[4-H-1-07] 医療情報を用いた肺がん患者の薬物治療効果への AI モデルの適用
AI (Artificial Inteligence), EHR (Electronic Health Record), Outcome, Treatment Response, Lung Cancer
【背景】多施設の電子医療情報に基づくデータベース(Electronic Health Record: EHR)の構築が国内外で進んでいる。EHRの研究利用への期待は大きいが、臨床アウトカムに関わるデータの多くは非構造化データで解析が困難という課題がある。本研究ではEHRから抽出した肺がん患者を対象に、薬物治療効果をAI(Artificial Intelligence)を用いて評価する方法を検討した。
【方法】宮崎大学医学部附属病院(以降、宮大)及び一般社団法人ライフデータイニシアチブの千年カルテデータべ―ス(以降、千年カルテ)の肺がん患者データを対象として後ろ向き研究を行った。BERTモデルを構築して、患者さんの経過記録や放射線レポートから薬物治療効果(奏効、安定、進行)の判定を行った。BERTモデルの精度はLongformerモデルおよびNaïve Bayesモデルと比較評価した。さらにBERTモデルによる千年カルテの治療効果データを用いて薬物治療ライン毎に進行までの期間(Time-to-Progression: TTP)を算出した。
【結果】事前学習並びに宮大の教師データ31名を基に構築したBERTモデルの精度は、Precision 0.42、Recall 0.63、F1値 0.50で、他の2つのモデルと比べて高い精度を示した。宮大データに基づくBERTモデルを千年カルテ(734名)に適応させたところ、同等の精度を示した。TTP中央値は治療ライン(1~4次)が遅くなるにしたがい短くなった。
【考察】他施設EHRの非構造化データを用いて、BERTモデルにより肺がん患者の薬物治療効果が得られた。今後、データをさらに蓄積し、モデルの精度の更なる改善が期待される。
【方法】宮崎大学医学部附属病院(以降、宮大)及び一般社団法人ライフデータイニシアチブの千年カルテデータべ―ス(以降、千年カルテ)の肺がん患者データを対象として後ろ向き研究を行った。BERTモデルを構築して、患者さんの経過記録や放射線レポートから薬物治療効果(奏効、安定、進行)の判定を行った。BERTモデルの精度はLongformerモデルおよびNaïve Bayesモデルと比較評価した。さらにBERTモデルによる千年カルテの治療効果データを用いて薬物治療ライン毎に進行までの期間(Time-to-Progression: TTP)を算出した。
【結果】事前学習並びに宮大の教師データ31名を基に構築したBERTモデルの精度は、Precision 0.42、Recall 0.63、F1値 0.50で、他の2つのモデルと比べて高い精度を示した。宮大データに基づくBERTモデルを千年カルテ(734名)に適応させたところ、同等の精度を示した。TTP中央値は治療ライン(1~4次)が遅くなるにしたがい短くなった。
【考察】他施設EHRの非構造化データを用いて、BERTモデルにより肺がん患者の薬物治療効果が得られた。今後、データをさらに蓄積し、モデルの精度の更なる改善が期待される。