[III-SY11-03] 決定木に基づくアンサンブル学習を用いた川崎病初回大量免疫グロブリン静注(IVIG)療法不応予測 -機械学習の臨床応用への可能性-
Keywords:機械学習, アンサンブル学習, Shapley Additive Explanation
【背景】決定木に基づくアンサンブル学習は、多数の決定木を組み合わせ、より精度の高い学習モデルを構築する機械学習の一手法である。本手法を用い、診断時の臨床データからIVIG不応を予測した。【方法】2010年から2020年の間に山梨大学および関連病院で診断・治療されたKD症例1002例を対象とした。227例(22.7%)が初回IVIG不応であった。説明変数は診断時の臨床データ計30項目、目的変数はIVIG反応性とし、全症例の80%をトレーニングデータ、20%をテストデータとした。決定木に基づくアンサンブル学習アルゴリズムであるRandom Forest法、Extreme Gradient Boosting法とLight Gradient Boosting Machine (Light GBM)法を用いてIVIG不応を予測し、各アルゴリズムの精度を比較した。また最も精度が高かったアルゴリズムの予測モデルに影響した説明変数をShapley Additive Explanation (SHAP)法で特定し、機械学習に基づく簡便なIVIG不応予測スコアを構築した。【結果】Light GBM法が各アルゴリズムでのIVIG不応予測の中で最も精度が高く、精度、感度、特異度はそれぞれ0.78、0.50、0.88 であった。SHAPの結果からLight GBM法での予測モデルに影響した上位3項目は、治療開始日、CRP値と総コレステロール値であった。解析結果から作成した新たなスコアの精度、感度、特異度はそれぞれ0.74、0.49、0.82であった。【考察】決定木に基づくアンサンブル学習は多重共線性を考慮する必要がなく、説明変数を大幅に増加させても解析が成立する。またSHAPは予測モデルでの説明変数の意義を明確化できる。今後、解析規模を拡張することで、新たな関連因子の発見、より簡便な予測モデルを作成が期待される。【結語】決定木に基づくアンサンブル学習とSHAPはIVIG不応予測および新たな予測スコアの作成に有用であった。今後、本手法を他の医療データに適応し、新たな予測モデルの構築や患者の層別化に応用できる可能性がある。