日本地球惑星科学連合2014年大会

講演情報

口頭発表

セッション記号 M (領域外・複数領域) » M-GI 地球科学一般・情報地球科学

[M-GI37_29AM1] 情報地球惑星科学と大量データ処理

2014年4月29日(火) 09:00 〜 10:30 413 (4F)

コンビーナ:*豊田 英司(気象庁予報部数値予報課)、村山 泰啓(独立行政法人 情報通信研究機構)、寺薗 淳也(会津大学)、堀 智昭(名古屋大学太陽地球環境研究所 ジオスペース研究センター)、大竹 和生(気象庁気象大学校)、若林 真由美(基礎地盤コンサルタンツ株式会社)、堀之内 武(北海道大学地球環境科学研究院)、野々垣 進(独立行政法人 産業技術総合研究所 地質情報研究部門 情報地質研究グループ)、座長:大竹 和生(気象庁気象大学校)

10:00 〜 10:15

[MGI37-05] NICT サイエンスクラウドを用いたかぐや衛星WFC-Lからのバイポーラ型波形抽出処理の高速化

*矢木 大介1村田 健史2笠原 禎也1後藤 由貴1 (1.金沢大学、2.情報通信研究機構)

キーワード:月探査衛星かぐや, 波形捕捉器, NICT サイエンスクラウド, 並列処理

月探査衛星かぐやは, 2007年9月に打ち上げられ, 2009年6月に月面に制御落下した. かぐや衛星には月周辺のプラズマ波動を観測する波形捕捉器WFCが搭載されており, 特に100Hz~100kHzの電界波形を観測するWFC-Lでは, これまでの研究からいくつかのパターンに分類できる特徴的なバイポーラ型の波形が多数確認されている. しかし, WFC-Lは250kHzのサンプリング周波数で波形データを取得することから, そのデータ総量は約190GBに達する. 我々は現在, この波形データからバイポーラ型波形を自動抽出するアルゴリズムを開発中であるが, 汎用のPCワークステーションでは, 全観測データから波形抽出を行うのに1週間近い処理時間を要する. これでは, より精度よく波形を抽出し, その分類を行うための処理アルゴリズムを試行錯誤するには, 大変非効率的である. そこで, 情報通信研究機構(NICT)のサイエンスクラウドを用いて, 処理の高速化を図った. NICTサイエンスクラウドは, 科学研究目的のために構築されたクラウドシステムで, 特にビッグデータサイエンスを主対象の一つにしている. 今回は, NICTサイエンスクラウド上でワークフローシステムを用いた並列分散処理による高速化を行い, その効率について評価した結果を報告する. 実際の並列処理は, Pwrake (Parallel Workflow extension for Rake) と呼ばれるツールを用いて, サーバ群にワークフローを与えることで実現した. Pwrakeは, Ruby言語で記述されるビルドツールであるRakeをファイル共有システム向けに拡張したものである. Pwrake上に処理内容と使用するノード及びコア数を記述することで, コマンドをタスクとして各ノードに割り振り並列処理を行うことが可能である. 結果として, 10ノード24コアの計算リソースを用いた場合, 1ノード1コアでの処理に比べて約140分の1の時間で処理を終えることが確認できた. 処理速度が使用リソース数に比例していないのはハイパースレッドの影響によると考えられる. 同システムを活用することで, より精度の高い波形抽出アルゴリズムの開発が効率よく行えることが期待できる. 今後は, 波形抽出アルゴリズムの改善に加えて, 更に計算リソースを増やした場合の測定実験についても実施する予定である.