Japan Association for Medical Informatics

[2-F-3-OP10-6] オープンエンド型発見手法と深層学習を用いた外来初診時記録からの候補病名予測の検討

山ノ内 祥訓1, 廣瀬 隼2, 宇宿 功市郎2 (1.熊本大学医学部附属病院 総合臨床研究部, 2.熊本大学医学部附属病院 医療情報経営企画部)

【はじめに】医療者が記載する経過記録やレポートは、自然言語で記載されることから二次活用が困難である。当院では2017年1月に稼働した新病院情報管理システムのデータ分析環境の一部に、文章内の意味のある一連のユニット(エンティティ)で分割でき、単語辞書が不要なオープンエンド型発見手法による自然言語解析エンジンを導入した。本研究では、この手法を利用して外来初診時における診療記録を解析し、深層学習することで病名が予測できるかを検証する。
【方法】2015年1月から2017年3月より匿名化した初診日SOAP記録をオープンエンド型発見手法による自然言語解析を行ったのちにエンティティと対応する病名を抽出した。次に、このデータを深層学習させ、エンティティに対する病名の予測精度を検証した。
【結果】自然言語解析で初診記録52904件が検出され、481446のエンティティ、470の病名が抽出された。これを入力ベルトル1000次元、出力ベルトル470次元に次元圧縮したデータとし、隠れ層4層の多層パーセプトロンを用いて学習させた。実際の病名と予測した病名を比較した結果、全体平均で病名適合率0.95(0.75-1.0)、病名再現率0.61(0.29-1.0)、AUC0.86(0.65-1.0)、F値0.74となった。再現率の低い場合には、同義語を含むエンティティが多かった。
【考察】外来初診時の記録をもとに病名を平均95%予測することができた。適合率の高さは、本手法により記載内容の特徴を抽出できた可能性があると考えている。再現率の低さは、過学習であること以外に、同義語同士の組み合わせで特徴量がノイズに紛れたことが要因と考えている。同義語の集約化で精度向上を期待している。今後は予測病名から推定されるエンティティと実際のエンティティの差異を可視化し、記載の支援を行えるアプリケーションの試作を予定している。