Japan Association for Medical Informatics

[4-B-3-4] ヘルスケア領域におけるオープンデータの検討

小林 慎治1,2, 粂 直人1, 吉原 博幸1 (1.京都大学EHR共同研究講座, 2.IMIA Open Source Working Group)

背景と目的オープンデータの活用は2009年にオバマ米国大統領がTransparancy and Open Governmentという覚書を出したことにより、政策的に展開され世界中にその動きが広まりつつある。ヘルスケア領域においてもオープンデータの活用は進められており、IMIAのOpen Source Working Groupでも現状の調査を行いYearbookに報告した。本論文ではその報告を元に日本におけるオープンデータについて紹介し、ヘルスケア領域における問題点について検討を試みる。方法文献およびインターネット検索によりオープンデータを公開しているサイトをリストアップした。それぞれのサイトについて内容の妥当性について評価したあと、それぞれのサイトでで公開されているルスケア領域でのオープンデータについて、その内容について検討を行った。結果2018年6月現在、日本ではdata.go.jpで「社会保障・衛生」グループとして健康および医療に関連したオープンデータが843件のデータセットが公開されていた。データの利用規約はオープンデータの定義を満たしており、研究などへの自由な利用が可能となっていた。データ形式としてはPDF、Microsfot Excel形式(xls, xlsx)、CSVなどで公開されていた。データは統計的なものが多く個人を特定できる情報は発見されなかった。考察同時期に米国、英国のオープンデータポータルでは2000件をこすデータセットが公開されていることと比較すると日本でのオープンデータは量的に少ない。データの利用規約はCC-BYをベースとしたものであり、オープンデータの定義を満たしてはいるものの、データ形式としてPDFでのみ提供されているもの118件もあり、機械処理を行う上で問題となると考えられた。ヘルスケア領域ではプライバシーの保護がオープンデータとして懸念されるが、検討の範囲ではみあたらなかった。