自然言語処理ツールからみた医師診療録－看護記録間の情報不均一性

Yukinori Mashima

[4-H-1-03] 自然言語処理ツールからみた医師診療録－看護記録間の情報不均一性

*Yukinori Mashima^1,2, Masatoshi Tanigawa¹, Hideto Yokoi^1,2 (1. 香川大学医学部附属病院　臨床研究支援センター, 2. 香川大学医学部　医療情報学講座)

Electronic Health Records, Text Mining, Natural Language Processing, International Classification of Diseases, Information Heterogeneity

序論：自然言語処理(NLP)を用いた電子カルテ内の種々の叙述的記録の二次利用が模索されている。本研究では、医師診療録と看護記録における症候名や診断名の記載に注目し、NLPからみた両文書の情報不均一性を検証した。

材料と方法：2021年1月～2021年12月に香川大学医学部附属病院の消化器内科、消化器病棟に入院した患者1113名から、83名を無作為抽出した。対象に関するフリーテキスト形式の医師診療録、看護記録（806日分）を収集し、本研究に用いた。NLPツールは、奈良先端科学技術大学院大学開発のMedNER-Jを使用した。[Step 1]消化器病専門医が103日分（全体の13.2%）のカルテレビューを行い、それをゴールドスタンダード(GS)としてMedNER-Jの妥当性を評価した。[Step 2]MedNER-Jによる国際疾病分類の第18章（症状、徴候及び異常臨床所見・異常検査所見で他に分類されないもの(R00-R99)、以下Rコード）の抽出有無を、日単位に集計した。併せて、診断名を中心に構成されるその他の章についても同様に集計した。

結果と考察：[Step 1]医師診療録に対するMedNER-Jの出力とGSのKappa係数は0.61、同様に看護記録では0.66であり、本研究の実施にあたりMedNER-Jは十分な性能を有した。[Step 2]552日(68.5%)の医師診療録、606日(75.2%)の看護記録からRコードが抽出され、両者には有意な差を認めた（p値<0.01）。一方、その他多くの章では、医師診療録からの抽出が看護記録からのそれを上回った。

結論：共通の患者に対する記載者が異なる両文書をMedNER-Jにより分析したところ、症候名は看護記録から、診断名は医師診療録から多く抽出された。NLPツールを用いた電子カルテの二次利用を考える際、分析対象の特性を考慮する必要がある。

The 42nd Joint Conference on Medical Informatics

[4-H-1-03] 自然言語処理ツールからみた医師診療録－看護記録間の情報不均一性