[4-E-1-1] IBM ワトソンを利用した電子カルテからの自然言語処理の試み
これまで、国立循環器病研究センターの循環器疾患患者に関して、電子カルテ記事から人工知能応用による自然言語処理を用い、胸痛、浮腫など症状の有無(大項目8項目、小項目25項目)について自動抽出が可能か検討した上で予測因子としての有用性を検討している。抽出にはIBM[社のワトソンエクスプローラーを用いた辞書チューニングを行い、AIによる教師あり学習をサポートした。入院中に自由記載されたカルテのSOAP記事を使用した(看護記録含む)約2000名、約60万行のカルテ記事を読み込み、症候の出現頻度を患者ごとに集積したところ、ほぼ医学的に問題ない精度の症候抽出は可能であった。さらに抽出した症候を既存の予測モデルに加えた場合10%程度の予測精度の向上を認めた。現在までに米国AHA/ACCによる循環器疾患に関する総合的なレジストリーであるNCDRのPINNACLE registryについて約400項目のうち約55%は既存の構造化データから自動抽出が確認であり、既往歴、身体所見、症状、など更に本年度の8月時点で約100項目の情報を電子カルテの情報から抽出し、総項目の約85%の抽出が可能となっている。記述の形態素解析、構文分析(特に日本語における係り受け)などの強みを持つ点が技術的特色であり、表記ゆれを含めた多義性に対して専門医による辞書チューニング作業を加えて、精度向上を行っている。今後2年程度で脳卒中を含めた循環器領域に関しては、心カテ、心エコー所見などの電子カルテ部門システムにわたる詳細項目を含め、臨床研究および将来的な臨床試験への応用を見据えた自動抽出システムを構築可能である。さらに抽出した情報をもとにMACE(Major Adverse Cardiac Event)の発症を人工知能により予測可能かを検討している。本年度からは冠動脈不安定ブラークの心臓MRI画像からの自動抽出アルゴリズム開発など画像解析にも応用している。