一般社団法人 日本医療情報学会

[2-H-2-03] 日本語病名正規化システムの開発

*氏家 翔吾1、矢田 竣太郎1、若宮 翔子1、荒牧 英治1 (1. 奈良先端科学技術大学院大学)

Disease Name Normalization, Word Sense Disambiguation, Natural Language Processing, Electronic Health Records, Named Entity Normalization


【背景・目的】診療録や症例報告(医療文書)などに記述される病名の抽出,及び正規化は,医療文書からの知識獲得や検索システムにおいて重要である.英語においては病名の抽出・正規化の標準的ツールが整備され,医療文書解析の基礎となっている.日本語においても病名抽出システムは開発されてきたが,病名の正規化は辞書検索や編集距離による正規化に止まっており,表現が似通う病名しか扱えない問題がある.本研究では,日本語の病名に対して病名正規化手法の定量的評価を行い,病名正規化ツールの開発・公開を行う.【方法】病名に対して,TF-IDFを用いたランキング学習により標準病名マスター収載の標準病名に紐付けることで正規化を行った.実験材料として,1)診療録や退院サマリから抽出した病名と標準病名の組み30415件,2)NTCIR11 shared task MedNLP2で使用された模擬診療録49件内の病名2121件を用いて性能評価を行った.2については,病名抽出から正規化までの一貫した精度評価も行った.【結果・考察】1における標準病名への紐付けにおいて精度0.69,2における病名抽出を含む評価においてF値0.459の精度を得た.ひらがなと漢字などの異なる文字種間の変換や英語の混在などの問題も見られ,日本の医療文書の言語的特徴を考慮した手法の有用性が示唆された.本発表では開発したツールを公開し,今後の発展の可能性について議論する.