Japan Association for Medical Informatics

[2-C-2-4] 医療情報からPhenotypingを行う共通基盤

平松 達雄 (東京大学医学部附属病院 企画情報運営部)

 文部科研「レセプトデータからphenotypingを行なう各種方法の評価」においては、HISやSS-MIX2から得られる検査結果値から判断できる患者状態を対象とすることで評価の自動化を図り、これにより大量の抽出アルゴリズムの実行と評価を行なう。研究実施にあたりレセプトやDPCデータからphenotypingを自動実行するための医療施設が参加しやすい共通基盤を整備しており、phenotypingの今後の発展のため本発表ではこの基盤に焦点を当てて紹介したい。
 抽出アルゴリズム研究は、個々の医療施設特有の事情によるバイアスを避けるため複数の医療施設のデータで行なう必要がある。このとき各施設から全データを1箇所に集めて研究する方法だと患者情報保護上の懸念により研究参加施設が集まりにくく、今回の研究では各医療施設内で各施設の研究者がそれぞれ自施設分を分担する構成とし、複数施設で同一の抽出アルゴリズムを実行して結果を比較検討する方法を採用した。このためには同一プログラムにより各施設のデータを対象に同一の抽出動作を行なうための共通基盤が必要であり、その整備をおこなった。開発にあたっては各医療施設へ容易に配布でき、医療施設で実施しやすいものとなるよう心がけた。
 本共通基盤ではphenotyping特化ではなく汎用の分析二次利用向けに診療データを格納するOMOP形式のデータモデルを採用している。OMOP形式は米国発祥だが欧州やアジアでも利用され国際的な規格に位置づけられる。OMOP形式採用にあたり、日本の診療データへの適合性や日本で利用できない用語集の回避を考慮して、一部日本拡張を加え日本での標準コードを使用するOMOP-JV (Japanese Vocabulary)を定めた。レセプトやSS-MIX2等のソースデータから、まずはOMOP-JV(国内利用)へ、次に元のOMOP(国際利用)へ、という2段階方式でのOMOP対応とする。国内利用においては日本の標準を使用するOMOP-JVが圧倒的に扱いやすい。元のOMOP形式を使用する国際共同研究等へOMOP-JVを利用するには、データ形式の変換は不要だが、用語を日本標準からOMOPで使用する標準へ変換する。