15:20 〜 15:40
[4D3-E-2-05] 健診データを用いた生活習慣病の発症予測
キーワード:機械学習、クラスの不均衡、医療情報
本研究では,定期的な健診データを用いて生活習慣病の発症を予測する手法を提案する.レセプトデータを精査して疾病の発症を特定し,それらを教師あり学習のための正例として使用した.クラスバランスが不均衡なデータであるという問題に対処するために,アンダーサンプリングとバギングのアプローチを採用した.がん以外の生活習慣病が1年以内に発症するかどうかを予測することを目的とした.提案手法のprecisionとrecallはそれぞれ0.32と0.89であった.各検査項目に閾値を設定し,それらの論理和をとるというベースライン手法と比較して,提案手法はrecallを維持しながらより高いprecisionが得られることが分かった.これは,重症化しそうな対象者の見落としを増やすことなく,保健指導の対象者数を抑えることができるという点で意義がある.