Japan Association for Medical Informatics

[2-F-2-3] 入院レセプトの主傷病名推定に有効な説明変数の検討

山下 英俊1, 倉沢 央2, 河添 悦昌3, 大江 和彦1,3 (1.東京大学大学院 医学系研究科 医療情報学分野, 2.日本電信電話株式会社, 3.東京大学医学部附属病院 企画情報運営部)

【背景】国民の医療状況を正確に把握する上で国のレセプト等DB(NDB)の外来レセプトデータは悉皆性に優れるものの、半数以上の記録は過去の主傷病名が複数記載されており、患者の現在の主たる病名を把握できない。一方、DPC病院における入院レセプトは、主傷病名(主病名)や医療資源を最も消費した傷病名(医療資源病名)を含め、最大13区分の病名(病名リスト)を記載する形式を用いてDPC病院が厳密に運用している。【目的】入院レセプトを用いて、病名リスト、診療行為等から主病名を推定する学習モデルを開発し精度を評価する。また推定に影響を与える変数を検討し、外来レセプトを用いた主病名推定に応用可能か考察する。【方法】入院レセプトから病名リスト、検査や手術等の診療行為、医薬品の情報を抽出し、これらを意味分類したコード体系に変換した上で、その全分類を含むホットベクトルで有無情報を表現した1593次元の説明変数を作成する。目的変数は主病名のICD10コードに対応するワンホットベクトルとし、正則化項付きロジスティック回帰による分析を行った。【結果】主病名の推定精度は約8割であり、この結果は他の機械学習手法でも同程度であったことから、学習モデルによる差は小さいと考えられた。正則化により選択された説明変数は、病名リストに含まれる癌や心疾患等の病名が上位を占めており、説明変数として病名リストのみを用いても正解率の低下は限定的だった。また説明変数を診療行為と医薬品に限定した場合でも、病名リストの中から主病名を分類するタスクとすることで約7割の正解率が得られた。【考察】入院レセプトを用いた主病名の推定において、病名リストが精度に大きく貢献したことから、外来レセプトにおいても同様に、病名リストを用いて主病名を推定できる可能性がある。今後は年齢・性別等の患者情報を説明変数に加え、外来レセプトで評価を行う予定である。