Japan Association for Medical Informatics

[2-D-2-02] ベイズ統計学を用いた死亡率の推定手法に関する考察―大規模医療データベースの分析結果に基づく事前分布の設定

古畑 宏樹1,2、小川 泰右1、松尾 亮輔1、山崎 友義1、荒木 賢二1 (1. 宮崎大学医学部附属病院 病院IR部, 2. 宮崎大学大学院 医学獣医学総合研究科)

Bayesian statistics, Conjugate prior distribution, Decision tree, Electronic medical record

【目的】ベイズ統計学を用いた死亡率の推定事例として、小地域推定という手法を用いて市町村単位の値を求めたものが多い。この手法は、地域単位でのサンプルサイズが小さい点などを克服するための様々な工夫がなされているが、研究成果の積み上げの結果としてモデリングの方法が複雑化している。本研究では、先に提案した「直近入院時の死亡確率を過去の治療状況を用いて予測するモデル」を事前分布として使用し、モデリングの単純化可能性について考察した。

【対象と方法】宮崎大学医学部附属病院の電子カルテに蓄積されているデータを使用した。事前確率の予測モデル(決定木)の構築には入院年月日が2013年4月1日から2015年3月31日までのもの(N=22,424、うち死亡831)を、検証用データには入院日が2015年4月1日から2018年3月31日までのもの(N=22,658、うち死亡802)を使用した。

【結果】検証用データにおける粗死亡率(更新前)と更新後死亡率(事後確率、共役事前分布に基づき計算)は、それぞれ3.54%±0.12%、3.62%±0.09%であった(平均値±標準偏差)。すべてのノードについて、更新後死亡率の標準偏差が粗死亡率を下回っていた。

【結語】更新後死亡率の標準偏差が粗死亡率のそれを大きく下回るのは、先行研究にも同様の結果が多くあり、事後確率への更新により値のばらつきを抑制できる点において利点があることがわかる。将来における本研究成果の応用として、冒頭に述べた「小地域ごとの推定」を「医療圏ごとの推定」に読み替え、医療圏ごとの基幹病院(≒DPC対象病院)主体による情報交換ネットワークを構築しデータの蓄積とモデルの個別化を行うことで、医療政策面における貢献可能性が示唆される。