Japan Association for Medical Informatics

[3-E-3-01] SS-MIX2標準化ストレージの病名情報からバイオバンク検体カタログの主たる病名を推定するためのAIモデルの構築

Yasumichi Sakai1, *Kodai Shimbori1, Katsushige Furuya1, Masamichi Ishii2, Satoshi Suzuki3, Reiko Kiuchi3, Hiroyuki Hoshimoto2, Keiko Suganuma2, Nobukazu Namiki1, Kengo Miyo2 (1. 三菱電機ソフトウエア株式会社, 2. 国立国際医療研究センター 医療情報基盤センター, 3. 国立国際医療研究センター 臨床研究連携部門 バイオバンク科)

Biobank, LIMS, ICD10, AI

【背景・目的】
現在、バイオバンクでは検体の検索を容易にするため、検体カタログに検体採取時の主たる病名を登録している。ところが、検体カタログへの主たる病名の登録には、電子カルテシステムに記載された検査結果、処方、術前術後記録などの診療情報をもとに、病名一覧から3件程度を手作業で選定しており、作業効率がよくない。 一方、バイオバンクの検体の情報は、LIMS(Laboratory Information Management System)を用いて、SS-MIX2標準化ストレージに出力された病名情報や処方情報などとともに一元管理されている。 そこで、我々はバイオバンクの検体カタログに必要な主たる病名の登録を効率化するため、LIMSに蓄積されているSS-MIX2標準化ストレージ中の病名情報から主たる病名を推定するAIモデルを構築した。

【方法】
SS-MIX2標準化ストレージに出力された病名情報のICD10コードと、すでに主たる病名が付与された検体情報を用いて、全検体の全病名の中で主たる病名に選択される度合い(絶対選択率)と、2つの病名を比べた場合に主たる病名として選択されやすい度合い(相対選択率)を算出し、病名に序列をつけた。さらに推定結果の精度を向上するために、優先的に選択する病名リスト(ホワイトリスト)と推定結果から除外する病名リスト(ブラックリスト)を適用し、最終的に上位10件程度のICD10コードを主たる病名の候補とした。

【結果・考察】
推定の再現率は9割を超えたものの、適合率は5割程度であった。現時点では、AIモデルで主たる病名の候補を推定したのち、手作業で確定することを想定しているため、高い再現率を実現した今回のAIモデルは十分に運用に耐えうるものと考える。今後は安定して精度を出し続けるための工夫や、ICD11コードへの対応についても検討が必要である。