JpGU-AGU Joint Meeting 2020

講演情報

[J] 口頭発表

セッション記号 U (ユニオン) » ユニオン

[U-12] 地球惑星科学の進むべき道10ビッグデータとオープンサイエンス

2020年7月15日(水) 14:15 〜 15:45 Ch.1

コンビーナ:藤井 良一(情報•システム研究機構)、川幡 穂高(東京大学 大気海洋研究所)、田近 英一(東京大学大学院理学系研究科地球惑星科学専攻)、木村 学(東京海洋大学・海洋資源環境学部)、座長:木村 学(東京海洋大学・海洋資源環境学部)、田近 英一(東京大学大学院理学系研究科地球惑星科学専攻)

15:00 〜 15:15

[U12-03] 宇宙科学分野におけるオープンサイエンスとデータ・サンプルマネージメント

★招待講演

*海老沢 研1 (1.宇宙航空研究開発機構・宇宙科学研究所)

キーワード:宇宙科学、オープンサイエンス、データアーカイブ、データポリシー

宇宙航空研究開発機構(JAXA)・宇宙科学研究所(ISAS)は、国内外の大学や機関と協力し、宇宙機・飛翔体を用いた宇宙科学の研究を行っている。2016年度、ISASの諮問委員会である宇宙理工学委員会が、「宇宙科学研究所が保有するデータの取り扱いに関する提⾔」を提出した。その提言は、以下の7項からなる:1.データの種類によらず汎⽤かつ有⽤なデータは公開し、⻑期的に保管すること。2.論⽂や学会等で公表された結果の根拠となるデータは公開し、⻑期的に保管すること。 3.⾮公開データは保管期限を定め、期限後に扱いを⾒直すこと。4.⾮公開データを集約し、確実に保管するためのシステムを整備すること。5.所が積極的に、データに関する様々な判断や交渉を行うこと。6.データに関する様々な事項を審議するための有識者委員会を設けること。7.宇宙科学コミュニティを対象に、データ整備・利⽤に関する継続的調査・支援を⾏うこと。これらの提言を実行に移す形で、ISASを中心に、宇宙科学データの整備・公開が進められている。

上記提言に基づき、所内に「科学データ専門委員会」が設置され、「宇宙科学研究所のデータポリシー (ISAS Data Policy)」を定めた。これはJAXA文書として登録されるとともに、ISAS HPから日本後・英語で公開されている。宇宙科学における「オープンサイエンス」の観点から、データポリシーの要点を以下に述べる。

当ポリシーは、ISASが取得・整備するデータに適用されるが、データ作成に必要なリソースをISASが提供することによって他機関が取得・整備したデータについても適用されることを期待している。本ポリシーが対象とする「データ」とは、「広い意味で科学的な価値を持つ情報であり、特定の物理的な媒体に依存せずに、汎用的・⻑期的に利用できるもの」である。よって、物理的な実体としての「サンプル」はデータには含まれないが、分析結果等を電子化したものはデータとして扱われる。「非公開データ・公開データの考え方」として、公表された成果のエビデンスデータは公開、それ以外のデータも公開を原則としており、データを「非公開」とする理由を以下に限定している:個人情報の保護や公共の安全等に支障がある場合。処理が不完全であることが明示されておらず、間違った結果が発表される可能性がある場合。研究チームが、一定期間占有利用する場合。利用権を特定の他機関等に付与する場合。

公開データに関わるポリシーは以下のとおりである:公知の知識のみで利用できるよう適切なデータ処理やデータの説明を行う。データは利用できる状態で⻑期間(30年以上)保管する。必要なデータを簡単に見つけ、使いやすくするためのサービスを無償で提供する。DOI等の永続的な識別子を用いて、データを引用しやすくする。また、公開データ利用の際のルールは、CC-BY4.0や政府標準利用規約(第2.0版)に従い、データの出典を示す限り無償で利用でき、用途は問わない(商業利用も可)。

データポリシーが定まったことによって、ISAS内外のデータ整備が進んできた。まず、何がデータでデータでないかがはっきりし、データと分類したものについては、公開か非公開かが定められた。非公開データについては、その期限と責任者を定めた上で、確実に保管するようにした(例:SMILES や「かぐや」のL0/1データ)。ISAS以外の機関にも帰属するデータについては、交渉して公開にこぎつけ、利用ルールを定めた(例:「かぐや」HDTVデータ)。衛星運用終了時に未処理の生データが蓄積している場合には、予算をつけて高次処理・公開を進めた(例:「あかり」)。一部のデータについては、DOI付与が進んでいる(例:SMILES、「あかつき」)。また、大学が中心となって、ISAS衛星のデータ処理・公開、ユーザー支援を行っている場合もある(例:「あらせ」)。

2016年度以降、過去のISASミッションが取得し、大学等に散逸しているデータの整備・公開を進めている。宇宙理学・工学メンバーを対象に公募を発出し、採択提案に対して、ISASが整備のための予算を支援している。そのようにして整備・公開されたデータ種は、約20になる。

このように、ISASが取得したデータについては、組織として責任を持って、衛星や装置固有の知識なしで誰でも利用できるように高次処理した上で、オープンデータとして公開している。これらのデータには恣意性がなく、誰にとっても平等な研究のスタート地点になる。一方、研究者が独自の視点や意図をもって、処理・加工したデータ(=恣意性がある)については、ISASはその正当性(integrity)に責任を持てないが、これも積極的に公開を進めていくことで、研究の発展が期待される。しかし、「組織」ではなく「研究者個人」が責任をもつデータを長期保管し公開する枠組みは、未だ確立していない。それが現在のISASの課題であるが、それは、国内あるいは世界的なオープンサイエンスにおける課題ともいえよう。