Japan Association for Medical Informatics

[3-F-2-JS4-1] 人工知能応用による自然言語処理を活用した電子カルテのセマンティック登録と 全国登録事業への将来展望

西村 邦宏 (National Cerebral and Cardiovascular Center)

国立循環器病研究センターの循環器疾患患者に関して、電子カルテ記事から人工知能応用による自然言語処理を用い、胸痛、浮腫など症状の有無(大項目8項目、小項目25項目)について自動抽出が可能か検討した上で予測因子としての有用性を検討した。抽出にはIBM[社のワトソンエクスプローラーを用いた辞書チューニングを行い、AIによる教師あり学習をサポートした。入院中に自由記載されたカルテのSOAP記事を使用した(看護記録含む)約60万行のカルテ記事を読み込み、症候の出現頻度を患者ごとに集積したところ、ほぼ医学的に問題ない精度の症候抽出は可能であった。さらに抽出した症候を既存の予測モデルに加えた場合10%程度の予測精度の向上を認めた。
現在米国AHA/ACCによる循環器疾患に関する総合的なレジストリーであるNCDRのPINNACLE registryについて約400項目のうち約75%は既存の構造化データから自動抽出が確認であり、既往歴、身体所見、症状、など更に本年度の8月時点で約100項目の情報を電子カルテの情報から抽出し、総項目の約85%の抽出が可能となっている。

さらに、1年後のMACE(Major Adverse Cardiac Event)の発症を人工知能により予測可能かを検討した。古典的サポートベクターマシンおよびランダムフォレストの複数モデルを組み合わせたアンサンブル学習により、MACE予測モデルを構築した。学習用データセットでは偽陽性5%程度、偽陰性立5%程度で予測するモデルが生成可能であり、検証用データセットでも高リスク群,低リスク群に関してAUC0.88で予後予測が可能であった。この成績はGRACE研究などの既存のMACE予測モデルの成績より感度、特異度ともに約20%程度向上していた。

今回はこれらの結果を含め、セマンティツクスを活用した今後の全国登録への展望について報告する