一般社団法人 日本医療情報学会

[2-C-2-1] データ駆動型医学研究におけるPhenotypingの重要性

中島 直樹 (九州大学病院メディカルインフォメーションセンター)

 レセプト電算化に続き、電子カルテ化、特定健診の普及などが進み、保健医療領域にも大量のデータが蓄積しつつある。また、厚生労働省はがんゲノム医療中核拠点病院事業を立ち上げ、Precision Medicineをがん領域で推進し始めた。つまり実医療データ(Real World Medical Data, RWMD)としてゲノム情報も蓄積し始めた。さらに今後は、IoT(モノのインターネット)を含めて医療施設外での生体情報の電子化も進むであろう。この蓄積したRWMDを適切に2次利用して医学研究に用いる手法をデータ駆動型医学研究という。
 データ駆動型医学研究を進めるにあたり、データ品質の上での大きな2つの課題が、1)標準コードへの適切なマッピングが進んでいないこと、2)RWMDに正確なPhenotypeがタイムリーに記録されていないこと、である。後者は、現在の電子カルテ、およびレセプトシステムが保険病名ベースで開発が進められてきた弊害であり、根本的な是正には制度改正を含めた大きな改革が必要である。しかしながら、既に蓄積したRWMDを活用するために、Phenotyping手法を用いて可能な限り精緻なPhenotype を描出することが有効である。その目的で日本医療情報学会では、2016年に課題研究会としてePhenotyping研究会を発足した。
 自験例を述べると、ある医療施設では1型糖尿病の保険病名で患者を抽出し専門医がレビューしたところ、真の1型糖尿病は55%であった。もし遺伝子研究などの目的で1型糖尿病をカルテから保険病名で抽出したら、45%は偽症例が混入するわけである。このことから、現在既に蓄積しているデータを少しでも精緻な状態で、あるいは精度は低くとも正確に把握した上で、データ駆動型医学研究を進めるべきことが理解できる。本発表では、具体的なRWMDからのPhenotyping開発手法を含めて発表する。陽性的中率を上げるために機械学習を用いて網羅的にPhenotypingのアルゴリズムを構築する一方で、できる限り感度を正確に把握するために、構造化データのみならず非構造化データも用いて真の症例を抽出し解析している。