一般社団法人 日本医療情報学会

[3-C-3-OP22-4] 疾患横断的なe-phenotyping手法開発を目的とした各疾患の特徴の検討

香川 璃奈1, 河添 悦昌2, 篠原 恵美子2, 今井 健3, 大江 和彦1 (1.東京大学大学院, 2.東京大学医学部附属病院, 3.東京大学疾患生命工学センター)

【背景】電子的診療データを用いた解析で重要な情報の一つは病名であるが、保険目的に登録される病名は信頼性が低く、DPC病名の利用も入院患者に限定される。そこで複数種類の診療データから特定の疾患を有する症例を自動で抽出するe-phenotyping手法が必要とされる。
【目的と手法】e-phenotyping手法開発の観点から各疾患について電子カルテデータの特徴を明らかにすることを目的とする。本稿では複数の疾患についてカルテに明示的にその疾患の有無が記載されるか否かを調査した。慢性疾患か急性疾患か、患者数の多寡、診断において重視される検査種、といった臨床的特徴の異なる10疾患を対象とした。医師2名が目視でカルテを確認し、対象疾患の有無を判断する上で必要とした情報の分類を記録した(カルテを確認した対象患者数は疾患毎に異なり280人-650人(平均461.9人))。用いた分類は対象疾患のうち4疾患の記録作業を通して筆者らが作成と改良を行い、残りの6疾患に対して同じ基準を用いた。その結果から、カルテ自然文における対象疾患名の記載や診断基準を満たすなどの明示的な情報のみで判断が可能な症例のみの疾患と、鑑別疾患や類似する疾患の記載、治療内容など、対象疾患については非明示的な情報が必要な症例が存在する疾患の調査を行った。
【結果】対象疾患のうち2型糖尿病、クローン病、本態性高血圧では非明示的な情報を用いないと疾患の有無の判断が変わる症例が存在した。その他の7疾患のうち乳癌、腎細胞癌、肺塞栓について、文字列一致のルールで患者抽出を行ったところ、感度は95%以上、陽性的中率は80%以上であった。
【考察】2タイプの疾患の違いの原因として、2型糖尿病に対する二次性糖尿病のように鑑別が難しい疾患の存在、患者が高齢のため厳密に鑑別疾患との区別を行わない症例の存在などが考えられた。このような疾患は、検査結果などの構造化データや自然文データなどの総合的な利用がe-phenotyping手法開発に必要と考えられる。