Japan Association for Medical Informatics

[3-H-1-CS3-2] 医師の作成した診療録を解析するためのフレームワークおよび自然言語処理

篠原 恵美子1, 今井 健2 (1.東京大学医学部附属病院, 2.東京大学大学院医学系研究科)

診療録のテキストに含まれる情報は患者の症状や医師の判断など重要な内容を含み、診療情報の利活用という観点からこれを構造化する手法が必要とされている。診療情報の利活用にはさまざまな目的があり、中でも個々の医師・患者に適用される意思決定支援や処方に関する警告システム等においては解析誤りがインシデント・アクシデントを引き起こす可能性があり、非常に高い解析精度が求められる。自然言語処理研究では機械学習手法が主流となっているが、精度向上に必要な十分な量の学習データの準備だけでなく特定の解析誤りへの対応も困難であることから、医療現場への導入は慎重にならざるを得ない。一方、古くから研究されてきたフレームベース・知識ベースの手法は高い精度を達成した実績があるものの、解析のために必要な知識の作成・管理が容易でないという問題点があった。しかし現在では用語集やオントロジーなどのリソースが整いつつあり、また医学知識と自然言語の文法知識を分離することで知識管理の困難は大幅に減ると考えられる。特に診療録の中でも医師が記述するものは医学的内容が中心であり、医学領域に限定すれば網羅的な知識の記述は決して非現実的ではない。また、テキストからの情報抽出を困難にする要因の1つが「肺炎に注意」の記載から肺炎の有無を判定する等「行間を読む」ことであるが、我々は、医師が記述した診療録を対象とした場合に、自然言語処理が解決すべき課題を「書かれていることを文字通りに解釈し構造化すること」に限定し、それ以上の解釈は自然言語処理の後、他の構造化データ等と合わせて行うべきであると考えている。このような考えから、症状・所見・診断などの患者状態、および投薬・処置などの医療者の介入に関する情報を構造化し抽出する知識ベース手法の構築を目指しており、本シンポジウムではその概略を紹介する。