一般社団法人 日本医療情報学会

[4-H-1-07] 医療情報を用いた肺がん患者の薬物治療効果への AI モデルの適用

*荒木 賢二1、松元 信弘2、東郷 香苗3、米本 直裕3、大木 恵美子4、徐 凌華3、長谷川 義行5、竹本 涼太5、佐藤 大輔6、宮崎 泰可2 (1. 宮崎大学医学部附属病院病院 IR部, 2. 宮崎大学医学部内科学講座 呼吸器・膠原病・感染症・脳神経内科学分野, 3. ファイザー株式会社ヘルスアンドバリュー統括部, 4. ファイザー株式会社オンコロジー部門メディカルアフェアーズ部, 5. 株式会社NTTデータ 製造ITイノベーション事業本部, 6. 株式会社NTTデータ 技術革新統括本部)

AI (Artificial Inteligence), EHR (Electronic Health Record), Outcome, Treatment Response, Lung Cancer

【背景】多施設の電子医療情報に基づくデータベース(Electronic Health Record: EHR)の構築が国内外で進んでいる。EHRの研究利用への期待は大きいが、臨床アウトカムに関わるデータの多くは非構造化データで解析が困難という課題がある。本研究ではEHRから抽出した肺がん患者を対象に、薬物治療効果をAI(Artificial Intelligence)を用いて評価する方法を検討した。
【方法】宮崎大学医学部附属病院(以降、宮大)及び一般社団法人ライフデータイニシアチブの千年カルテデータべ―ス(以降、千年カルテ)の肺がん患者データを対象として後ろ向き研究を行った。BERTモデルを構築して、患者さんの経過記録や放射線レポートから薬物治療効果(奏効、安定、進行)の判定を行った。BERTモデルの精度はLongformerモデルおよびNaïve Bayesモデルと比較評価した。さらにBERTモデルによる千年カルテの治療効果データを用いて薬物治療ライン毎に進行までの期間(Time-to-Progression: TTP)を算出した。
【結果】事前学習並びに宮大の教師データ31名を基に構築したBERTモデルの精度は、Precision 0.42、Recall 0.63、F1値 0.50で、他の2つのモデルと比べて高い精度を示した。宮大データに基づくBERTモデルを千年カルテ(734名)に適応させたところ、同等の精度を示した。TTP中央値は治療ライン(1~4次)が遅くなるにしたがい短くなった。
【考察】他施設EHRの非構造化データを用いて、BERTモデルにより肺がん患者の薬物治療効果が得られた。今後、データをさらに蓄積し、モデルの精度の更なる改善が期待される。