[OA-10-5] 口述発表:脳血管疾患等 10XGBoostは回復期リハ病棟脳卒中患者の自宅退院の予測精度をどこまで高めることができるか
【はじめに】
近年,機械学習分野は著しい発展を遂げている.勾配ブースティングと決定木を組み合わせた手法であるextreme gradient boosting(XGBoost)は2014年に発表されて以降,その非常に高い精度と汎化能力から,さまざまな分野で適用され始めている.医学分野においては2019年頃から徐々にXGBoostを用いた予後予測の研究報告が増えてきており,例えば脳卒中関連では脳動脈瘤破裂リスク(Ou, et al. 2020)や再入院の予測(Darabi, et al. 2021)でXGBoostモデルの高い有用性が報告されている.XGBoostは作業療法分野においても様々なアウトカムの予測を高い精度で行うことができる可能性を秘めていると考えられる.しかし,XGBoostをリハビリテーション関連のアウトカムに応用した報告は国内外を問わずほとんど見当たらないのが現状である.
【目的】
回復期リハ病棟脳卒中患者において入院早期から自宅退院が可能か否かを把握できることは介入計画立案を行う上で重要である.本研究の目的は同患者の自宅退院可否の予測モデルをXGBoostで作成し,その精度を検証することで,同モデルの有用性を明らかにすることである.
【方法】
本研究は後方視的観察研究で,2011~2017年に回復期リハ病棟に入退院した初発脳卒中患者231名(年齢72.9±14.1歳)を対象とした.本研究内容は演者らの所属する施設の倫理審査委員会において審議され,実施の承認が得られている.
本研究では従属変数を自宅退院と自宅外退院の2値とした.なお,自宅退院が自宅外退院と比較して多数を占める不均衡データとなるため,少数データのクラス(本研究では自宅外退院)の識別率が極端に低くなる問題に対応するため,オーバーサンプリング手法としてSMOTE-NC(Chawla, 2002)を事前に行い,データ不均衡の調整を図った.予測に用いる特徴量(独立変数)は,一般的に入手が容易である変数が望ましいと考え,性・年齢,麻痺側,入院時FIM18項目の得点のみとした.比較対象として,ロジスティック回帰,決定木,サポートベクターマシン,ランダムフォレスト,ニューラルネットワークでも同変数を用いてモデルを作成した.各予測モデルの精度の算出および比較のため10分割交差検証を20回繰り返し,算出された正解率とF-measureを分散分析と多重比較(Bonferroni補正を用いたt検定)により比較した.
【結果】
本研究対象の転帰先は自宅192名(83.1%),自宅以外39名(16.9%)であった.XGBoostの正解率とF-measureは89.5±0.7%と0.89±0.01であり,他のすべてのモデルよりも有意に高かった(p<0.01).他のモデルの正解率とF-measureはそれぞれランダムフォレストで86.7±1.3%と0.86±0.01,ニューラルネットワークで86.7±1.8%と0.86±0.02,決定木で81.5±1.2%と0.81±0.02,ロジスティック回帰で80.2±0.7%と0.79±0.01であった.
【考察】
XGBoostの活用により,性・年齢,麻痺側および入院時FIM得点のみの限られた情報から回復期リハ病棟脳卒中患者の自宅退院の可否を約90%の精度で予測できること,そして他のアルゴリズムによりも高い精度の予測モデルが作成できることが明らかとなった.約90%の精度は十分に実用的なレベルと考えられ,このようなモデルの普及は作業療法士の臨床判断を補助するツールになる可能性がある.また本研究知見はXGBoostの作業療法分野への応用可能性を示し,今後のさらなる発展を示唆するものである.
近年,機械学習分野は著しい発展を遂げている.勾配ブースティングと決定木を組み合わせた手法であるextreme gradient boosting(XGBoost)は2014年に発表されて以降,その非常に高い精度と汎化能力から,さまざまな分野で適用され始めている.医学分野においては2019年頃から徐々にXGBoostを用いた予後予測の研究報告が増えてきており,例えば脳卒中関連では脳動脈瘤破裂リスク(Ou, et al. 2020)や再入院の予測(Darabi, et al. 2021)でXGBoostモデルの高い有用性が報告されている.XGBoostは作業療法分野においても様々なアウトカムの予測を高い精度で行うことができる可能性を秘めていると考えられる.しかし,XGBoostをリハビリテーション関連のアウトカムに応用した報告は国内外を問わずほとんど見当たらないのが現状である.
【目的】
回復期リハ病棟脳卒中患者において入院早期から自宅退院が可能か否かを把握できることは介入計画立案を行う上で重要である.本研究の目的は同患者の自宅退院可否の予測モデルをXGBoostで作成し,その精度を検証することで,同モデルの有用性を明らかにすることである.
【方法】
本研究は後方視的観察研究で,2011~2017年に回復期リハ病棟に入退院した初発脳卒中患者231名(年齢72.9±14.1歳)を対象とした.本研究内容は演者らの所属する施設の倫理審査委員会において審議され,実施の承認が得られている.
本研究では従属変数を自宅退院と自宅外退院の2値とした.なお,自宅退院が自宅外退院と比較して多数を占める不均衡データとなるため,少数データのクラス(本研究では自宅外退院)の識別率が極端に低くなる問題に対応するため,オーバーサンプリング手法としてSMOTE-NC(Chawla, 2002)を事前に行い,データ不均衡の調整を図った.予測に用いる特徴量(独立変数)は,一般的に入手が容易である変数が望ましいと考え,性・年齢,麻痺側,入院時FIM18項目の得点のみとした.比較対象として,ロジスティック回帰,決定木,サポートベクターマシン,ランダムフォレスト,ニューラルネットワークでも同変数を用いてモデルを作成した.各予測モデルの精度の算出および比較のため10分割交差検証を20回繰り返し,算出された正解率とF-measureを分散分析と多重比較(Bonferroni補正を用いたt検定)により比較した.
【結果】
本研究対象の転帰先は自宅192名(83.1%),自宅以外39名(16.9%)であった.XGBoostの正解率とF-measureは89.5±0.7%と0.89±0.01であり,他のすべてのモデルよりも有意に高かった(p<0.01).他のモデルの正解率とF-measureはそれぞれランダムフォレストで86.7±1.3%と0.86±0.01,ニューラルネットワークで86.7±1.8%と0.86±0.02,決定木で81.5±1.2%と0.81±0.02,ロジスティック回帰で80.2±0.7%と0.79±0.01であった.
【考察】
XGBoostの活用により,性・年齢,麻痺側および入院時FIM得点のみの限られた情報から回復期リハ病棟脳卒中患者の自宅退院の可否を約90%の精度で予測できること,そして他のアルゴリズムによりも高い精度の予測モデルが作成できることが明らかとなった.約90%の精度は十分に実用的なレベルと考えられ,このようなモデルの普及は作業療法士の臨床判断を補助するツールになる可能性がある.また本研究知見はXGBoostの作業療法分野への応用可能性を示し,今後のさらなる発展を示唆するものである.