一般社団法人 日本医療情報学会

[3-J-6-06] 中国の大規模疫学調査データ (China Health and Retirement Longitudinal Study;CHARLS)を用いた脳卒中の予測及び要因分析

*肖 禹辰1、福西 広晃1 (1. 東京工科大学大学院 バイオ・情報メディア研究科)

Disease prediction, Stroke, Machine Learning, Explainable AI, SHAP

【目的】「中国脳卒中報告2021」によると、脳卒中は中国で早期死亡と疾病負担の主要な原因となっている。本研究では中国の大規模疫学調査データ(China Health and Retirement Longitudinal Study, CHARLS)を活用し、機械学習による脳卒中予測モデルの構築と要因分析を行う。これにより、脳卒中患者の早期診断と予防を支援することを目的とする。
【方法】本研究では、3年後の脳卒中の発症リスクを予測するモデルを構築した。目的変数は2018年の脳卒中の罹患有無、説明変数は 2015年のCHARLS から抽出した300個以上の生活習慣や健康診断等に関する特徴量とした。機械学習アルゴリズムとして、決定木ベースの勾配ブースティング手法LighGBMを用いた。要因分析では、協力ゲーム理論のShapley Valueを応用したSHAP(SHapley Additive exPlanations)を用いて各特徴量の予測への貢献度を評価した。
【結果】65歳から89歳までの高齢者を対象として構築した予測モデルは、正解率が70%を超えた。SHAPによる要因分析の結果では、脳卒中に大きな影響を与える要因として、血圧、昼寝、握力が含まれていた。血圧は高いほど、また、昼寝の時間は長いほど脳卒中のリスクが高まる傾向があった。利き手の握力が強いほど脳卒中のリスクが高くなる一方、利き手ではない手の握力が強い場合は低くなる傾向があった。
【考察・結論】本研究により高血圧が脳卒中リスクを増加させるという医学的な知見と一致する結果が得られた。昼寝時間に関しては、W.Liらの研究(Sleep Breath,2021)によれば一日中の睡眠時間が脳卒中の発症との関連あったが、昼寝の時間がとの関連が見られなかった。握力に関しては、D. P. Leongらの研究(Lancet,2015)によれば、利き手の区別がないが、握力の低下が脳卒中リスクと関連があった。本研究により、比較的高い予測精度で脳卒中の発症を予測できることと、その予測結果の根拠を提示できることが示された。
【倫理的配慮】本研究で使用したCHARLSの倫理的承認は北京大学倫理審査委員会により承認され、参加者全員が書面によるインフォームドコンセントを行った。