Japan Association for Medical Informatics

[3-J-6-05] 特定健康診査データを用いた高血圧症発症を予測する機械学習モデルの構築

*Takafumi Okawa1, Kohei Yoshida2, Fumiya Kimura3, Yuuna Sakai3, Aina Ozawa4, Mitsuo Uchida1, Yuki Aoki1, Yumi Sato2,3, Takayuki Saitoh2,3 (1. Gunma university graduate school of medicine, 2. Gunma university graduate school of health science, 3. Gunma university graduate school of public health , 4. Gunma university school of health science)

machine learning, specific health checkup, hypertension

【目的】特定健康診査は、生活習慣病の重症化を防ぐための取り組みである。この健診で生活習慣病発症リスクの高い個人をスクリーニングすることができれば、発症前の段階から個々の特徴に沿った保健指導を展開することができ、医療費の増加や個人のQOL低下の抑制につながる。しかし、標準的な手法はまだ確立されていない。今回は、特定健康診査データを用いて、生活習慣病を5年後に発症しているか予測する、新たなモデルを構築することを目的とした。【方法】本研究では、群馬県の国民健康保険の2011-2021年の特定健康診査データを使用した。特徴量として、特定健康診査データから得られる個人情報、生体検査値、既往歴・服薬状況・生活習慣の問診情報など32の項目を用いた。予測する対象を高血圧の新規発症とした。機械学習は、識別器にLightGBMを用いるモデルを採用した。また、不均衡データを有効的に学習するために、アンダーサンプリングとバギングを組み合わせた学習を行なった。評価指標は再現率、適合率及びROC-AUCを用いて行なった。すべての分析にPython3を使用した。【結果】2011年から2016年に健診を受診した人(n=924,932)のうち、5年後に再度受診していた131,857人を高血圧発症予測モデル構築に用いた。高血圧症の再現率は0.991、適合率は0.28、ROC-AUCは0.885であった。ROC-AUCは既存の統計学的な手法と比較しても高い結果を示した。【考察・結論】本研究では、特定健康診査データを用いて、高血圧症発症の予測モデルを提案した。単年のデータにもかかわらず再現率、ROC-AUCが高い値を示したため、本モデルは生活習慣病のスクリーニングに有用であることが示唆された。【倫理的配慮】本研究は所属大学の倫理委員会の承認(HS2023-137)を得て実施した。