Japan Association for Medical Informatics

[4-H-1-04] 死亡診断書における死因テキストのICDコード化および原死因の自動決定の試み

*Kenichi Yokota1, Mariko Mine1 (1. 長崎大学原爆後障害医療研究所)

Death certificate, ICD10 coding, Underlying cause of death

我々は原爆被爆者集団の疫学解析に必要な死亡情報収集のため、死亡診断書に基づき原死因のデータ化を行っている。近年、診療情報管理士の人的資源の確保が難しく業務の省力化のため、原死因決定の支援のためのシステム開発が必要となっている。本研究では同様なシステムの開発や関連する研究に資することができる情報提供を目的とした。
死亡診断書には直接死因のほか、その原因や影響した疾病名など、複数の疾病名等が記入され、ルールに従い原死因が選択される。疾病名はバリエーションに富んでいるため、まずは記載された疾病名をICDコードに変換し、さらにコードの組合せから原死因に対応させるという2段階の処理とした。テキストはダブルエントリーを行っている。前者の辞書はテキストからICDコードへの変換辞書(辞書1)であり、後者はICDコードの組合せと原死因との対応辞書(辞書2)である。辞書を用いた変換では効率の限界があるが、逐次学習させることにより改善できると考えた。
辞書1は、すでに専門職によるICDコード化が完了している2009年から2015年のデータを用いて、テキストデータを対応させて作成した。作成時の登録数は3,247語であった。2016年のテキストデータに適用したところ該当率は87.0%であった。さらに順次学習を進め2020年のデータでは該当率が89.6%まで改善した。辞書2については、過去の蓄積データのうちICD-10コード化を開始した1995年から2008年までの死因と原死因の対応パターン約9千件を作成した。現在、2009~2015年のデータで専門職が決めた原死因との比較、評価を行っている。学習効果を試行したところ、2009年と2015年の該当率はそれぞれ58.8%と63.8%であった。さらに2020年まで学習させると69.3%まで改善することが見込まれた。原死因決定作業の大幅な省力化が期待できる。