Japan Association for Medical Informatics

[4-F-2-03] 言語生成モデルによる病名読み推定

*Takanori Senoo1, Shuntaro Yada1, Shoko Wakamiya1, Eiji Aramaki1 (1. 奈良先端科学技術大学院大学)

Natural Language Processing, Pretrained Language Model, Text-to-Text Transfer Transformer, Speech Recognition, Digital Scribe

【背景・目的】医療現場の不十分な電子化による医療従事者への過度な負担を軽減させるため,音声入力の実現が期待されている.医療現場における音声入力には読みが付与された病名辞書が必須であり,この自動付与が望まれるが,正確な病名読み推定に本格的に取り組んだ事例は少ない.広く利用されている条件付確率場(CRF)ベースの既存技術では,英数字が読みに変換されない,あるいは漢字の音訓が正しく変換されないという問題が存在する.本研究では,低頻度の漢字のみならず,英数字なども含め多様な文字種に対しても読みを生成するシステムを構築する.
【方法】複数の言語処理タスクをテキスト生成の枠組みで統一的に解ける事前学習済み言語モデルT5を用いた転移学習により,読み推定をテキスト生成タスク(読み生成)として解く.具体的には,Wikipedia全文などの日本語コーパスで事前学習済みのT5モデルを転移学習させることにより,低頻度の漢字や英数字などを含む病名の読みを生成する.予備的な読み生成においては,訓練データに含まれない漢字の読みが生成されず,漢字がそのまま出力されるという問題が確認されたため,日本語形態素解析器JUMANの辞書から抽出した名詞の漢字と読み20,047件を訓練データに加えることで,幅広い漢字に対して頑健な読み生成モデルを実現する.性能評価には,標準病名マスター収載の標準病名27,145件を用い,ベースラインとして,日本語形態素解析器MeCab を用いたCRFベースの手法との比較を行なった.
【結果・考察】標準病名に対して正解率0.951での読み生成を達成した.CRFベースの手法の正解率は0.885であった.辞書を訓練データに用いない場合の正解率は0.937であり,辞書による高度化が性能に寄与した.エラー分析を通じて,低頻度の漢字や英数字などを含む病名の読みも生成できる可能性が示された.