Japan Association for Medical Informatics

[2-H-2-02] テキスト含意認識AIを活用した原発性免疫不全症患者の判別分析

*Tsukasa Odo1, Kohsuke Imai2, Akifumi Endo2, Tomohiro Morio2, Hideyuki Taketa1, Hideki Tanimura1, Shinichi Okada3, Hirofumi Seki3 (1. NECソリューションイノベータ株式会社, 2. 国立大学法人東京医科歯科大学, 3. 日本電気株式会社)

Primary Immunodeficiency, AI, Primary Immunodeficiency Database in Japan


【1.背景】

原発性免疫不全症(略称:PID)は国の指定難病であるが、1万人に1人程度の希少疾患であり、実際には専門医以外では診断が困難である。そのため、プライマリケア医のための診断支援システムが求められている。そこで本研究は、紹介状などプライマリケア医らが記載したテキストデータとスクリーニングでの検査結果値に着目し、PIDをプライマリケアの段階で高精度に判別可能なAIモデル作成を目的とした

【2.手法】

PIDの患者データが登録されているPIDJ(Primary Immunodeficiency Database in Japan)から、「遺伝子検査結果が陽性かつ易感染症を呈する患者」と「臨床的に分類不能型免疫不全症と診断された患者」88件を正例の分析対象とする。また、同じくPIDJ上で上記の対象群以外から同件数を無作為に抽出し負例として分析に用いる。プライマリケア医らが記載したテキストと、基準値を基にテキスト化した10種類の検査項目を、精度評価の観点から組み合わせを検討し説明変数に用いる。そして、テキスト含意認識AIツールを用いて判別分析モデルの学習と評価をホールドアウト法により約4:1に分割して行う。

【3.結果】

組み合わせの検討結果、説明変数に用いる検査項目として「好中球」「IgG」「T細胞」の3種類を用いた。判別分析モデルの評価結果は、正解率80.6[%]、F値82.1[%]であった。また、作成したモデルが重要と判断した単語列には、PIDの主症状である「肺炎」や、PID患者が異常値を示す事が多い検査項目の「IgG」などがあげられた。

【4.結論】
本研究では、PIDの一部の疾患を対象としてテキスト含意認識AIによる判別モデルの作成及び評価を行い、高精度なモデルが作成できた。今後は、対象の疾患を増やし、より多くの希少疾患を判別できるモデル作成をすることで、患者と医師の支援に務めたい。