画像診断レポートから自然言語処理を用いて癌を疑う所見を自動抽出する取り組み - J-MIDを活用した多施設研究 -

Kento Sugimoto

[2-I-3-06] 画像診断レポートから自然言語処理を用いて癌を疑う所見を自動抽出する取り組み - J-MIDを活用した多施設研究 -

*Kento Sugimoto¹, Shoya Wada¹, Shozo Konishi¹, Junya Sato¹, Katsuki Okada¹, Shoji Kido^1,2, Noriyuki Tomiyama¹, Yasushi Matsumura^1,3, Toshihiro Takeda¹ (1. 大阪大学大学院医学系研究科, 2. 大阪大学放射線科学基盤機構, 3. 国立病院機構大阪医療センター)

Natural language processing, Radiology reports, Follow-up studies, Clinical practice management

【目的】
画像診断レポートには、診断やフォローアップに関する重要な情報が多く含まれており、診療プロセスの重要なプロセスの一部となっている。画像診断には重篤な疾患や予期せぬ所見などが記載される場合があるが、主治医の確認漏れなどのヒューマンエラーが原因となり、適切な対応が取られないことがある。この問題の解決に向けて、我々は「がんを疑う所見を含むレポート」を抽出するシステムを開発した。
【方法】
我々が開発した機械学習による構造化システムを用いて、レポートを構造化する。次に、事前に作成した辞書と紐づけ、「がん」を疑う所見にラベル付けを行う。同時に解剖区域も事前に作成した辞書を参照し、適切なコードを紐付ける。これにより、レポートの臨床所見が「がん」を疑う臨床所見である場合にシステムが、その区域情報とともに「がんを疑うレポート」として抽出するようにした。性能評価では、胸腹部CTレポートを使用し、大阪大学医学部附属病院における150枚の内部検証に加えて、外部検証を目的として日本医用画像データベース（Japan Medical Image Database：J-MID）に登録された5施設からサンプルした750枚のレポートを使用した。
【結果】
レポート全体での分類結果はPrecision、Recall、F1値でそれぞれ92.6%、92.1%、92.3%、を達成した。内部検証セットおよび外部検証セットで分けた場合、Precision、Recall、F1値は内部検証セットで95.8 %、94.7 %、95.1%、外部検証セットで92.4% %、91.7%、91.9 %であった。
【考察・結論】
内部検証セットだけではなく、外部検証セットでも高い性能を達成しており、我々のシステムが一般化可用性が高いことが示された。しかし、外部検証セットでは、レポートの書き方・単語の違いなどからシステムが対応できない事例もいくつか確認されており、一般化可用性を更に高めるための今後の課題も明らかになった。
【倫理的配慮】
本研究は大阪大学医学部附属病院の倫理審査委員会の承認を得て実施した。

The 44th Joint Conference on Medical Informatics

[2-I-3-06] 画像診断レポートから自然言語処理を用いて癌を疑う所見を自動抽出する取り組み - J-MIDを活用した多施設研究 -