データ駆動型医学研究におけるPhenotypingの重要性

中島 直樹

[2-C-2-1] データ駆動型医学研究におけるPhenotypingの重要性

^○中島直樹 (九州大学病院メディカルインフォメーションセンター)

　レセプト電算化に続き、電子カルテ化、特定健診の普及などが進み、保健医療領域にも大量のデータが蓄積しつつある。また、厚生労働省はがんゲノム医療中核拠点病院事業を立ち上げ、Precision Medicineをがん領域で推進し始めた。つまり実医療データ（Real World Medical Data, RWMD）としてゲノム情報も蓄積し始めた。さらに今後は、IoT（モノのインターネット）を含めて医療施設外での生体情報の電子化も進むであろう。この蓄積したRWMDを適切に2次利用して医学研究に用いる手法をデータ駆動型医学研究という。
　データ駆動型医学研究を進めるにあたり、データ品質の上での大きな２つの課題が、１）標準コードへの適切なマッピングが進んでいないこと、２）RWMDに正確なPhenotypeがタイムリーに記録されていないこと、である。後者は、現在の電子カルテ、およびレセプトシステムが保険病名ベースで開発が進められてきた弊害であり、根本的な是正には制度改正を含めた大きな改革が必要である。しかしながら、既に蓄積したRWMDを活用するために、Phenotyping手法を用いて可能な限り精緻なPhenotype を描出することが有効である。その目的で日本医療情報学会では、2016年に課題研究会としてePhenotyping研究会を発足した。
　自験例を述べると、ある医療施設では1型糖尿病の保険病名で患者を抽出し専門医がレビューしたところ、真の1型糖尿病は55％であった。もし遺伝子研究などの目的で1型糖尿病をカルテから保険病名で抽出したら、45％は偽症例が混入するわけである。このことから、現在既に蓄積しているデータを少しでも精緻な状態で、あるいは精度は低くとも正確に把握した上で、データ駆動型医学研究を進めるべきことが理解できる。本発表では、具体的なRWMDからのPhenotyping開発手法を含めて発表する。陽性的中率を上げるために機械学習を用いて網羅的にPhenotypingのアルゴリズムを構築する一方で、できる限り感度を正確に把握するために、構造化データのみならず非構造化データも用いて真の症例を抽出し解析している。

The 38th Joint Conference on Medical Informatics

[2-C-2-1] データ駆動型医学研究におけるPhenotypingの重要性