日本地球惑星科学連合2014年大会

講演情報

口頭発表

セッション記号 M (領域外・複数領域) » M-GI 地球科学一般・情報地球科学

[M-GI37_29AM1] 情報地球惑星科学と大量データ処理

2014年4月29日(火) 09:00 〜 10:30 413 (4F)

コンビーナ:*豊田 英司(気象庁予報部数値予報課)、村山 泰啓(独立行政法人 情報通信研究機構)、寺薗 淳也(会津大学)、堀 智昭(名古屋大学太陽地球環境研究所 ジオスペース研究センター)、大竹 和生(気象庁気象大学校)、若林 真由美(基礎地盤コンサルタンツ株式会社)、堀之内 武(北海道大学地球環境科学研究院)、野々垣 進(独立行政法人 産業技術総合研究所 地質情報研究部門 情報地質研究グループ)、座長:大竹 和生(気象庁気象大学校)

09:30 〜 09:45

[MGI37-03] 分散ファイルシステムによる並列データI/O測定

*村田 健史1渡邉 英伸1鵜川 健太郎2村永 和哉2鈴木 豊2建部 修見3田中 昌宏3木村 映善4 (1.情報通信研究機構、2.株式会社 セック、3.筑波大学、4.愛媛大学)

現在、多くの科学研究分野ではデータのほとんどがデジタル化され、その量および種類は大規模化の一途をたどっている。これからますます大規模化・複雑化するデータ指向型科学時代を踏まえて、ビッグデータ処理がより容易に、また一元的行うことができるクラウドシステムが求められている。NICTサイエンスクラウドは、地球惑星科学を含む様々な科学研究データおよびソーシャルデータのためのクラウドシステムである。NICTサイエンスクラウドでは(1)データ伝送・データ取集機能、(2)データ保存・データ管理機能、(3)データ処理・データ可視化機能の3つの柱(機能)から構成されている。それぞれの機能についての基盤技術を開発するだけではなく、複数の基盤技術を組み合わせることでシステム化を行うことができる。システムを実際に科学研究に応用・適用することで、様々な分野でのビッグデータ科学・データインテンシブ科学が可能となる。本研究では、NICTサイエンスクラウド上で科学研究のビッグデータ処理を行うための基盤技術について議論する。データサイズが大きい場合にクラウドデータ処理で解決すべき問題点の一つはデータI/Oである。例えば、100MB/secで100TBのデータを読み出すとすると、1,000,000秒(約11.5日)かかる。すなわち、大規模科学データを処理するためには、高速I/O技術が不可欠である。本発表では、並列ファイルシステム(GPFS)と分散ファイルシステム(Gfarm)の2つのシステムでのデータ読み出し速度の比較を行い、それらのスケーラビリティーを比較する。