Japan Association for Medical Informatics

[2-F-3-02] 治療経過サマリ作成支援のための診察記事からの医療情報抽出

*Yutaka Uno1, Ryo Ishii2, Daisaku Shibata1, Masanori Tsujikawa1, Atsuhiro Nakagawa3, Masahiro Kubo1, Yukio Katori2 (1. 日本電気株式会社, 2. 東北大学病院 耳鼻咽喉・頭頸部外科, 3. 東北大学病院 産学連携室)

Medical Natural Language Processing, Named Entity Recognition, Progress Note, Deep Learning

[背景]いわゆる医師の働き方改革(医師に対する時間外労働の上限規制の適応開始)を目前に,医師の本来業務である患者の診察や検査,治療から離れた非本来業務に対して医療情報処理がその代替をすることが求められている.そこで我々は,医師の労働時間へのインパクトが大きい紹介状や診断書の作成にも応用可能な治療経過サマリの作成支援に取り組んでいる.
[目的]本研究の目的は,治療経過サマリ作成支援のための中間目標として入院患者に対する診察記事からの医療情報抽出である.患者の疾患,症状や身体所見,検査,投薬などの治療やそのアウトカム,今後の方針といった診察記事中の情報は,サマリ作成時に医師本人によって抽出されている.この抽出部分の機械学習モデルによる代替を,本研究では目指した.
[方法]本研究では,まず診察記事からの情報抽出向け用の注釈付け基準を作成した,これに基づいた教師データを作成し,事前学習済み深層言語モデルを微調整することで,医療固有表現抽出器(NERモデル)を作成した.この抽出器の抽出性能に対する機械的な評価と,サマリ作成に必要な情報に対して,抽出結果の品質・抽出漏れ・抽出誤りに関する医師による評価を実行した. [結果]NERモデルの機械評価の結果はMacro-F1で0.76であった.抽出品質の医師による評価は,個別の記事に対しての抽出漏れ・誤りは見られるが,特定の患者の診察記事の系列全体でみたときにサマリに記述すべき情報の抽出漏れは見られなかった. [考察]NERモデルによる情報抽出結果の治療経過サマリ作成支援タスクへの利用を考えたときに,アノテーションの誤りや,記事に反復して出現する内容が重複して抽出されること,またサマリ作成に不要な情報も抽出されることなど,一部品質に問題があるとわかった.抽出結果にフィルタリングを行い,サマリ作成のための必要十分な情報に絞ることが今後の課題である.