Japan Association for Medical Informatics

[3-F-2-01] 診療科の違いが医療文書からの固有表現抽出の精度に与える影響

*Daisaku Shibata1, Masanori Tsujikawa1, Yutaka Uno1, Ryo Ishii2, Atsuhiro Nakagawa2, Masahiro Kubo1, Yukio Katori2 (1. 日本電気株式会社, 2. 東北大学病院)

Natural Language Processing, Information Extraction, Deep Learning

【背景】医療文書から重要な医療用語を抽出する固有表現抽出 (NER)では、さまざまな診療科で作成された医療文書に対応できる必要があるが、学習データの作成に必要なコストは大きく、全ての診療科で学習データを作成することは困難である。【目的】ある診療科で作成された医療文書を用いて学習されたNERモデルが、異なる診療科で作成された医療文書に対してどの程度適用可能なのか評価を行う。【方法】東北大学病院の耳鼻咽喉・頭頸部外科、総合外科、循環器内科と消化器内科において作成された経過記録それぞれ600件に対して、病名や人体部位などの医療用語に対してアノテーションを行ったコーパスを学習データとして使用した。各診療科の学習データを8:2の割合で訓練データとテストデータに分割し、1つの診療科、2つの診療科と4つの診療科の訓練データで学習したモデルを作成し、テストデータに対する性能を評価した。【結果】1つの診療科の訓練データでモデルを学習した場合、訓練データに対応する診療科におけるテストデータのMicro-F1が最も高く、それ以外の診療科では対応する診療科に比べMicro-F1が低下することが確認された。また2つの診療科の訓練データをそれぞれ50%ずつ抽出し、モデルを学習した場合、対応する診療科であっても1つの診療科の場合と比較して精度が低下した。一方、2つの診療科の訓練データを全て使用してモデルを学習した場合、1つの診療科の場合よりも精度が上昇することがわかった。さらに4つの診療科の訓練データを全て用いてモデルを学習した場合、テストデータに対する精度が大きく改善することが明らかとなった。【考察・結論】医療文書を対象としたNERの学習においては、学習データが作成された診療科と学習データ量の2点がモデルの精度において重要であると考えられる。【倫理的配慮】東北大学病院の倫理審査を経て実施された。