16:15 〜 16:30
[MGI30-10] オープンサイエンスにおけるデータの品質管理とデータリポジトリの役割
キーワード:オープンサイエンス、データリポジトリ、品質管理
FAIR原則は、オープンサイエンスの元での研究データ公開における、国際的な規範として、広く認識されているが、データリポジトリ側から見ると、「品質管理されたデータが提供されている」ことが、自明のこととして想定されているような印象がある。しかしデータの品質管理のレベルはリポジトリによってかなり差が見られ、最終的なデータ品質の判断は、データユーザに任されているのが実情である。特に超高層物理学分野に於いては、データと言えば地磁気強度の時間変化のような時系列データが主体であり、物理・化学系分野に於けるファクトデータとは、データ品質の概念に於いてすら、大きな隔たりがある。また著者が関わっている宇宙線中性子フラックスの時系列データについても、現在はWDC for Cosmic Rays(名古屋大、https://cidas.isee.nagoya-u.ac.jp/WDCCR/)など、3ヶ所の国際的なデータリポジトリが存在するが、データの品質管理のレベルには、無修正からリポジトリ独自の再解析まで大きな隔たりがあるだけでは無く、最近では物理量の定義(特に時間分解能)にも不統一性が発生し、1953年以来の長期間データベースの連続性に問題が発生している。ここでは、宇宙線データの品質管理における経験をもとに、オープンデータの世界におけるデータの品質管理の在り方と、データリポジトリの役割について考察する。