Japan Association for Medical Informatics

[4-G-4-05] 集中治療室における再入室イベントを予測する機械学習ベースの生存時間解析モデルに時系列データが与える影響

*Shaonan Liu1, Yuta Nonomiya2,3, Yuichiro Iwashita4, Seiichi Kimura5, Miku Saito5, Oka Yamasaki6, Shoya Ishimaru4, Soichiro Nakako2,3, Hiroshi Okamura2,3, Masakazu Iwamura4, Koichi Kise4, Ayumi Shintani2 (1. 大阪府立大学 工学域, 2. 大阪公立大学 大学院医学研究科, 3. 大阪公立大学 医学部附属病院, 4. 大阪公立大学 大学院情報学研究科, 5. 大阪市立大学 医学部, 6. 大阪公立大学 医学部)

Survival Analysis, Intensive Care Unit, Time Series Data, Random Survival Forest, DeepSurv

【背景】集中治療室(ICU)の生存時間解析において、バイタルサインや血液検査など過去の検査結果を時系列特徴量として生存時間解析に加味した報告は少ない。一方、臨床医はこれらの経時推移情報を重要な予後因子として扱う 。そのため 、生存時間解析モデルの特徴量に時系列データを用いる影響を考察することは意義があると考える。我々は、 ICU退室患者におけるICUへの再入室予測モデル構築において、特徴量の交互作用や非線形関係を自動的に組み込むことができる生存時間解析モデルとしてRandom Survival Forest(RSF)とDeepSurvを用い、時系列データを加味する影響を調査した。

【方法】ICU患者のデータベースであるMIMIC-IVを用いて、ICU初回退室患者を対象に、同一入院におけるICU再入室イベントをアウトカムとし、退院を打ち切りとした生存時間解析モデルの構築とその予測精度を解析した。患者情報とバイタルサインや血液検査のICU退室前最終検査値からなる静的データのみを特徴量 としたパターン1と、パターン1の特徴量にICU入室後の経時的変化を反映した複数の時系列特徴量を加えたパターン2の2 パターンの予測モデルを 比較検討した。ここで、ICU入室後の全検査値の中央値や標準偏差などを時系列特徴量とした。

【結果】31,835例が解析対象となり、そのうちICU再入室は2,578例であった。RSFにおけるパターン1、2の Harrell’s C-index は、それぞれ 0.61、0.62であった。また、DeepSurvの Harrell’s C-index はそれぞれ0.59、0.62であった。

【結論】RSF、DeepSurvの両者において時系列データが予測精度の向上に寄与することが明らかとなった。しかし、DeepSurvがRSFと比べて予測精度の向上が顕著である要因は解明できておらず、今後の課題とする。