16:30 〜 16:45
[MAG32-10] 幅広い分野での活用を見据えた海洋観測データ公開の取り組み
キーワード:海洋観測データ、データ公開、データベース、netCDF、東北マリンサイエンス拠点形成事業
海洋研究開発機構(JAMSTEC)では、船舶による研究航海や潜水船などによる潜航調査で得られた大量の観測データを、“JAMSTEC航海・潜航データ・サンプル探索システム(DARWIN)”[1]にてインターネットへ公開している。このサイトは、取得された観測データの網羅的な公開を主な目的としており、実施された研究航海や潜航調査単位でデータが公開されている。各データにはデータの種類や調査船舶・潜水船、調査期間等の情報が付与されているため、それらの条件で絞り込み検索が可能であるとともに、各ページからデータファイルのダウンロードが可能である。
また、JAMSTECが参画する東北マリンサイエンス拠点形成事業(TEAMS)においても、DARWINと同様のサイトを公開している。TEAMSは、東日本大震災で大きく変化した東北沿岸域の海洋生態系の調査研究を通して、被害を受けた東北沿岸の漁業復興への貢献を目的とした事業で、取得された観測データの統合的管理、プロジェクト内部での迅速な共有、利用しやすい形での外部公開が重要な課題として位置付けられている。さらに、観測データを用いた東北沿岸域の海洋生態系モデルの構築が大きな研究課題の一つとなっている。この事業で取得された観測データは、“TEAMSデータ案内所「リアス」”[2]から外部公開されている。前述のDARWINと同様に、実施された調査観測ごとにデータをまとめて公開されており、付与された情報による絞り込み検索と、データファイルのダウンロードが可能である。
しかしながら、これらのデータ公開サイトはデータの公開・ダウンロード単位が実施された調査観測単位であるため、複数の調査観測で取得したデータを入手したい場合、個別にダウンロードしなければならない。また、ダウンロードしたデータファイルのフォーマットやデータの単位が統一されていないため、データを使用する際にフォーマットや単位の変換処理が必要となる。そのため、海洋生態系モデルの構築をはじめとした計算機シミュレーションを使った研究のように、できるだけ多くの環境データを調査観測に関わりなく、統一されたフォーマットで一括して扱いたいといった要望に応えることができていなかった。
このような課題に対応するため、新たに“TEAMS調査海域環境データベース(TEAMS-EBIS)”[3]を構築した。DARWINや「リアス」が網羅的なデータ公開に重点置いたサイトであるのに対して、TEAMS-EBISはデータファイルの扱いやすさに重点を置いたサイトで、複数の調査観測で取得されたデータを単一のファイルでダウンロードすることが可能となっている。ダウンロードできるデータファイルも、フォーマットやデータの単位が統一されており、関連するメタデータや引用表記リストも併せてダウンロードすることが可能である。また、今年実施された機能強化により、大気・海洋科学のデータを取り扱う際に広く使われているnetCDFフォーマットでのダウンロードに新たに対応した。これにより、計算機シミュレーションを使った研究を含む幅広い分野での観測データの活用が期待される。
今回TEAMS-EBISで開発したデータ公開の仕組みは、多様なデータへの応用が可能である。TEAMSは2021年に終了となるが、得られた成果を持続的に生かすため、今後DARWINを含めた他のデータベースシステムへ機能展開することも検討している。多くのデータ公開サイトにおいて、大量のデータが統一されたファイルフォーマットで一括してダウンロード可能になれば、より幅広い分野でのさらなるデータの活用が期待される。
参考
[1] http://www.godac.jamstec.go.jp/darwin/j
[2] http://www.i-teams.jp/rias/
[3] http://www.i-teams.jp/ebis/
また、JAMSTECが参画する東北マリンサイエンス拠点形成事業(TEAMS)においても、DARWINと同様のサイトを公開している。TEAMSは、東日本大震災で大きく変化した東北沿岸域の海洋生態系の調査研究を通して、被害を受けた東北沿岸の漁業復興への貢献を目的とした事業で、取得された観測データの統合的管理、プロジェクト内部での迅速な共有、利用しやすい形での外部公開が重要な課題として位置付けられている。さらに、観測データを用いた東北沿岸域の海洋生態系モデルの構築が大きな研究課題の一つとなっている。この事業で取得された観測データは、“TEAMSデータ案内所「リアス」”[2]から外部公開されている。前述のDARWINと同様に、実施された調査観測ごとにデータをまとめて公開されており、付与された情報による絞り込み検索と、データファイルのダウンロードが可能である。
しかしながら、これらのデータ公開サイトはデータの公開・ダウンロード単位が実施された調査観測単位であるため、複数の調査観測で取得したデータを入手したい場合、個別にダウンロードしなければならない。また、ダウンロードしたデータファイルのフォーマットやデータの単位が統一されていないため、データを使用する際にフォーマットや単位の変換処理が必要となる。そのため、海洋生態系モデルの構築をはじめとした計算機シミュレーションを使った研究のように、できるだけ多くの環境データを調査観測に関わりなく、統一されたフォーマットで一括して扱いたいといった要望に応えることができていなかった。
このような課題に対応するため、新たに“TEAMS調査海域環境データベース(TEAMS-EBIS)”[3]を構築した。DARWINや「リアス」が網羅的なデータ公開に重点置いたサイトであるのに対して、TEAMS-EBISはデータファイルの扱いやすさに重点を置いたサイトで、複数の調査観測で取得されたデータを単一のファイルでダウンロードすることが可能となっている。ダウンロードできるデータファイルも、フォーマットやデータの単位が統一されており、関連するメタデータや引用表記リストも併せてダウンロードすることが可能である。また、今年実施された機能強化により、大気・海洋科学のデータを取り扱う際に広く使われているnetCDFフォーマットでのダウンロードに新たに対応した。これにより、計算機シミュレーションを使った研究を含む幅広い分野での観測データの活用が期待される。
今回TEAMS-EBISで開発したデータ公開の仕組みは、多様なデータへの応用が可能である。TEAMSは2021年に終了となるが、得られた成果を持続的に生かすため、今後DARWINを含めた他のデータベースシステムへ機能展開することも検討している。多くのデータ公開サイトにおいて、大量のデータが統一されたファイルフォーマットで一括してダウンロード可能になれば、より幅広い分野でのさらなるデータの活用が期待される。
参考
[1] http://www.godac.jamstec.go.jp/darwin/j
[2] http://www.i-teams.jp/rias/
[3] http://www.i-teams.jp/ebis/