日本地球惑星科学連合2016年大会

講演情報

口頭発表

セッション記号 M (領域外・複数領域) » M-GI 地球科学一般・情報地球科学

[M-GI21] 情報地球惑星科学と大量データ処理

2016年5月24日(火) 09:00 〜 10:30 A02 (アパホテル&リゾート 東京ベイ幕張)

コンビーナ:*村田 健史(情報通信研究機構)、野々垣 進(国立研究開発法人 産業技術総合研究所 地質情報研究部門 情報地質研究グループ)、堀 智昭(名古屋大学宇宙地球環境研究所)、豊田 英司(気象庁予報部業務課)、寺薗 淳也(会津大学)、若林 真由美(基礎地盤コンサルタンツ株式会社)、堀之内 武(北海道大学地球環境科学研究院)、大竹 和生(気象庁気象大学校)、座長:堀之内 武(北海道大学地球環境科学研究院)、寺薗 淳也(会津大学)

10:00 〜 10:15

[MGI21-05] 100年天気図データベース:気象庁天気図を対象とした長期データアーカイブの構築

*北本 朝展1 (1.国立情報学研究所)

キーワード:天気図、データベース、幾何補正、ジオレファレンス、歴史資料、市民科学

地上や高層の気象観測データを統合・可視化し、広域におよぶ気象現象の理解と予測の鍵を握ってきた天気図は、日本の長期気象観測の歴史を記録した資料として中核的な価値をもつものである。そこで、気象庁およびその前身の気象台が1883年3月1日以来約134年間にわたって作成してきた天気図を対象とした長期データアーカイブを構築し、「100年天気図データベース」(http://agora.ex.nii.ac.jp/digital-typhoon/weather-chart/)として公開した。
データベースの中心的な存在となる天気図画像データは、1989年3月以降は「気象庁天気図」CD-ROMとして、それ以前は「気象庁天気図DVD版」として、一般財団法人気象業務支援センターが販売するデータを購入したものである。これらの画像データを統一的な方法で抽出し変換することで、年月日で天気図を検索・表示できるようにした。初期の天気図は日本周辺およびアジア太平洋域の地上天気図1種だけであるが、徐々に種類は増えて現在は8種類に達している。時系列で見ると少数ながら不規則な欠落はあるものの、おおむね連続性は保たれている。ただし1923年9月1日の関東大震災直後は、当時の中央気象台の焼失が原因とみられる欠落が20日ほど存在する。その結果、2016年2月現在で、地上天気図で108,599件、全体で232,298件の天気図データベースを構築し、ウェブサイトは2014年1月に試験公開、2015年11月に一般公開に入った。公開にあたっては気象庁のデータポリシーに従い、気象庁提供データの利用であることをクレジットで明記している。
データベースの当初の構想は、幾何補正(ジオレファレンス)済み天気図データベースの構築であった。しかし、10万枚を越える天気図を手動で幾何補正することは不可能であることから、プロセスの自動化が鍵を握ることとなった。そこで、参照画像における緯度経度交点の座標を収集した上で、任意の画像を参照画像に座標変換するパラメータを推定することで、任意の画像を自動的に幾何補正する方法を開発した。ただし図法が不明確な天気図もあることから、幾何補正は緯度経度のブロック単位で変換することとした。その結果、1958年8月以降の地上天気図はおおむね問題のない水準に達したことから、幾何補正済みの地上天気図をGoogle Earth、Google Maps、Cesium等のジオブラウザでオーバーレイ表示できるようにした。一方1958年7月以前については、地上天気図の保存状態が悪い場合があること、天気図フォーマットの変化が激しいことなどから、幾何補正が完了する見通しは立っていない。
次の課題はアーカイブの利便性向上である。上述の方法で年月日による検索は可能になったものの、メタデータが欠けているため高度な検索ができないという問題があった。そこで天気図のファインダビリティを向上させるため、以下の4つの機能を開発した。第一が、気象庁が提供する「日々の天気図」の記述を対象とした検索であり、これにより重要な気象現象等を対象としたキーワード検索が可能となった。第二が、「デジタル台風」が提供する他のデータベースとの連動であり、例えば台風を検索して台風上陸日の天気図にアクセスする、災害を条件指定で検索して災害発生日の天気図にアクセスするなど、多様なルートを経由した天気図へのアクセスが可能となった。第三が、著名な天気図に関する解説記事の執筆(協力:NPO法人気象キャスターネットワーク)であり、歴史的なイベントや極値を観測した日などに関する著名天気図29件や著名台風19件を選び、解説記事を経由した天気図へのアクセスが可能となった。第四が、複数タイムラインが同期した画像ブラウザ「SyncReel」の活用であり、時系列画像が映画フィルムのリールのように横に並ぶタイムラインというインタフェースを用いて、可変時間間隔のスクロールを用いて過去の天気図への効率的なアクセスが可能となった。
今後の課題は天気図という画像データに埋もれた情報の掘り起しである。テキスト文書であればOCRによる文字の自動抽出も可能であるが、天気図は線の重ね書きが多いため、ソフトウェアによる自動抽出は困難である。そこで、クラウドソーシングやシチズンサイエンスの方法論を用いて、科学者も市民も天気図から情報を抽出する活動に参加できる仕組みを用意することが望ましい。この方向では世界のいくつかのプロジェクトが実績を有しているものの、本研究に適用する際には以下の課題がある。第一がトレーニングであり、気圧単位の違いなどデータの抽出方法に関する基礎知識を共有する必要がある。第二が科学への貢献であり、参加する市民のモチベーションを高めるには、天気図という歴史資料を現代の科学に活用する道筋を明確に示す必要がある。
謝辞:本研究の一部は、科学研究費補助金・研究成果公開促進費(データベース):平成25年度(258062)、および文部科学省地球環境情報統融合プログラムなどの支援を受けた。