[2-G-3-02] 自然言語処理を用いた読影レポートからの重要所見の自動抽出に関する取り組み
Natural Language Processing, Radiology Report, Medical Safety
【目的】画像診断レポートには、診断やフォローアップに関する重要な情報が多く含まれており、診療プロセスの重要なプロセスの一部となっている。画像診断には重篤な疾患や予期せぬ所見などが記載される場合があるが、主治医の確認漏れなどのヒューマンエラーが原因となり、適切な対応が取られないことがある。この問題の解決に向けて、我々は「重要所見を含むレポート」を抽出するシステムを開発することを目指した。
【方法】 本研究では「ある患者の特定の領域において、はじめて『がん』を疑う記述があった所見」を「重要所見」として定義し、レポートを抽出することを目指した。まず、レポートを我々が開発した機械学習による構造化システム(杉本ら、2023)を用いて「どの解剖学的区域にどのような所見があったか」という情報を取り出せるように構造化しておく。次に、事前に作成した臨床所見の用語リストと紐づけ、「がん」を疑う臨床所見にラベル付けを行う。同時に解剖学的区域も事前に作成した用語リスと紐付ける。これにより、レポートの臨床所見が「がん」を疑う臨床所見である場合にシステムが、その区域情報とともに「がんを疑うレポート」として抽出するようにした。実験では、大阪大学医学部附属病院の264枚の胸腹部CTレポートを用いて、性能を評価した。
【結果】肺区域に関する重要所見の抽出結果は90%以上のF1値を達成した。一方、腹部領域に関する抽出結果は全体で約60%のF1値と低い結果となった。
【考察】腹部レポートは「骨盤区域周辺」のように具体的な臓器が示されない区域表現が多く、実用化に向けて性能改善の工夫を検討する。また、現時点ではシステムで患者単位に系列でレポートを処理し、過去のレポートの抽出結果と比較して、「はじめてかどうか」を判定する機能を実装できておらず、今後はこのアルゴリズム開発に取り組む。
【方法】 本研究では「ある患者の特定の領域において、はじめて『がん』を疑う記述があった所見」を「重要所見」として定義し、レポートを抽出することを目指した。まず、レポートを我々が開発した機械学習による構造化システム(杉本ら、2023)を用いて「どの解剖学的区域にどのような所見があったか」という情報を取り出せるように構造化しておく。次に、事前に作成した臨床所見の用語リストと紐づけ、「がん」を疑う臨床所見にラベル付けを行う。同時に解剖学的区域も事前に作成した用語リスと紐付ける。これにより、レポートの臨床所見が「がん」を疑う臨床所見である場合にシステムが、その区域情報とともに「がんを疑うレポート」として抽出するようにした。実験では、大阪大学医学部附属病院の264枚の胸腹部CTレポートを用いて、性能を評価した。
【結果】肺区域に関する重要所見の抽出結果は90%以上のF1値を達成した。一方、腹部領域に関する抽出結果は全体で約60%のF1値と低い結果となった。
【考察】腹部レポートは「骨盤区域周辺」のように具体的な臓器が示されない区域表現が多く、実用化に向けて性能改善の工夫を検討する。また、現時点ではシステムで患者単位に系列でレポートを処理し、過去のレポートの抽出結果と比較して、「はじめてかどうか」を判定する機能を実装できておらず、今後はこのアルゴリズム開発に取り組む。