日本地球惑星科学連合2018年大会

講演情報

[JJ] ポスター発表

セッション記号 M (領域外・複数領域) » M-GI 地球科学一般・情報地球科学

[M-GI29] オープンデータ&サイエンスの近年の状況

2018年5月23日(水) 10:45 〜 12:15 ポスター会場 (幕張メッセ国際展示場 7ホール)

コンビーナ:樋口 篤志(千葉大学環境リモートセンシング研究センター)、近藤 康久(総合地球環境学研究所)

[MGI29-P04] 地震ハザードに関する関係性を記述したメタデータセットJ-SHIS RDFの試作

*東 宏樹1松山 直道2 (1.国立研究開発法人防災科学技術研究所、2.株式会社創夢)

キーワード:地震ハザード、J-SHIS、RDF

1.はじめに
 政府は2013年頃より始まったオープンデータに関する一連の取り組みを経て、オープンデータ基本指針(2017)において政府予算により作成されたデータの原則公開・オープンデータ化を定めている。技術的にはLOD(リンクト・オープンデータ)を5つの段階に定義し、その最高峰の位置付けとしてRDF(Resource Description Framework)を用いたデータセットを挙げている。一方、政府の地震調査研究推進本部は全国地震動予測地図を作成しており、詳細データは2005年から防災科学技術研究所のJ-SHIS(地震ハザードステーション)を通じて公開されている。現在J-SHISではWeb mapやデータダウンロードページ、その解説や使い方を示したポータルや各種文書の他、サードパーティによって商用にも利用されているJ-SHIS Web APIを全て無償で提供している。今回両者の流れを橋渡しすべく、J-SHIS RDFの試作を開始したのでその取り組みを紹介する。


2.目的
 2017年5月に高度情報通信ネットワーク社会推進戦略本部・ 官民データ活用推進戦略会議にて決定された「オープンデータ基本指針」では、オープンデータの定義を(1)営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの(2)機械判読に適したもの(3)無償で利用できるものとし、さらに公開データの形式についてはWWW(ワールド・ワイド・ウェブ)の創始者であるTim Berners-Leeが提唱した5段階(通称「5つ星」)の指標を参考に、より活用がしやすい用語や形式での公開に努めるよう、原則が定められた。J-SHIS RDFは、既にオープンデータの定義に即して公開しているJ-SHIS Web API(現状は3.5つ星)を、さらにオープンデータの模範たる5つ星データに昇格させうる試みである。と、同時に、高度なドメイン知識を要求される専門的データでもある地震ハザード情報を、RDFの遡及力により利用者自身の関わる箇所を部分的にでも参照・理解しながら誤解なく使う(従来は1つ300ページ以上ある報告書を最低3本くらい読まないと分野外の人間が誤解なく扱うのは困難だった)ことが可能となれば、予測地図そのものが抱えている複数の課題の解決にも繋がるため、試作を開始した。

3.手法
 J-SHIS RDFはRDFの定義(W3C準拠)に則りJ-SHISに関連するデータ全てを資源(Resource)として捉え直し、その関係性の記述を行うことで、活用法を高度化することを試みたものである。試作版を作成するにあたって、3段階のプロセスを経たので、以下に示す。
段階1.基本粒度の設定:下位に行くほど細粒度の4つのレイヤーを設定し、上位2つを試作した。第2レイヤーである地図間関係整理レイヤーでは、関係者から見たJ-SHISの要素整理を行うことでプロジェクト全体の俯瞰を可能とするものを目指すべく、基本となる粒度を「地図」とした。
段階2.作成ポリシーの制定:地震動予測地図はその性質上どこを切っても科学的エビデンスを伴う必要があるため、報告書をベースに作成した。こうしたRDFを作成する上での基本方針を当該レイヤーの作成ポリシーとしてまとめた。
段階3.専門家によるファクトチェック:ちょうどいいサイズの(A3用紙1枚で出力して全体像が把握可能な)グラフを試作として出力し、専門家によるファクトチェックを受けた。さらに専門家からのフィードバックを受けての修正とクラスタリングを行い、指摘事項を踏まえたより良い可視化を試行した。

4.結果
 J-SHIS地図間関係RDFと名付けた第2レイヤーは66トリプルとなった(図)。地震本部部会関係RDFと名付けた第1レイヤーが5トリプルで記述可能であったことと比較するとかなり詳細なグラフとなった。この2レイヤーのRDFは内部に膨大なデータ群を有するノード間の関係を俯瞰するグラフであり、J-SHIS(予測地図)の作り方の流れが追いやすくなった。

5.課題と考察
 作業の過程でデータへの理解が深まった(つまり特に作った人の勉強になる)。記述したのは報告書ベースの事実の反映のはずだが、作成者の認知レベルも自ずと反映されてしまうことに気づけたため、段階3の専門家によるファクトチェックはどのレイヤーにおいても欠かせないものと考えられる。関連して、記述に当たっては特に述語の定義が難しく、今後語彙基盤との照合か、独自定義のスキーマが必要であると考えられた。また、作成してみて現状を上記のようにレイヤー1,2とした場合に、おおよそレイヤー4くらいまで作るとAPIの個別地点を記述可能であると予想された。これらのRDFの取り組みが予測地図ならびにJ-SHISの利活用における不確実性の理解促進と誤解低減にどの程度役立つかは未知数な部分も多く、今後レイヤー3,4の作成を通じて利活用例を示すなど、さらなる工夫が求められる。