Japan Association for Medical Informatics

[2-D-2-01] ランダムフォレストを用いた潜在的臨床判断値の探索

松尾 亮輔1、小川 泰右1、山﨑 友義1、荒木 賢二1、外山 比南子2 (1. 宮崎大学医学部附属病院病院IR部, 2. 医療データサイエンス研究所)

Latent Clinical Decision Limits, Random Forests, Knowledge Discovery

【背景】臨床検査値には,特定の病態を考慮しない健常者における基準範囲と,特定の病態に関して,その診断・予防や治療・予後の判定基準のための臨床判断値が定められている.説明変数の目的変数に対する重要度が得られるランダムフォレストが特徴選択に広く用いられているが,説明変数の潜在的な判断値を探索する手法があれば, 膨大な臨床検査データを用いた検査値に関する新たな臨床知識の発見が期待される.

【目的】ランダムフォレストの分岐情報を活用して,患者の病態に基づいた潜在的な臨床検査の判断値を探索するための方法を提案する.

【方法】始めに,ある病態の患者群内で検査項目の基準範囲を推定し,検査項目ごとに推定した基準範囲内の症例を抽出する.次に,抽出した症例を用いて,複数の検査項目を説明変数として予測モデルをランダムフォレストにより構築する.最後に,症例抽出に用いた特定の検査項目が重要度ランキングで上位の場合に,ランダムフォレストの分岐情報を集約して該当検査値と目的変数の関係性を可視化する.

【結果】宮崎大学医学部附属病院の2014年4月から2018年3月の検査データを用いた.DPCコードの6桁と手術あり,化学療法の有無に基づくDPCクラスタごとで,特定の検査項目の推定基準範囲内の症例に対して,入院時の複数の検査項目の値を用いて,在院日数の予測モデルをランダムフォレストにより構築した.可視化結果から,症例抽出に用いた血小板数,平均赤血球容積,平均血小板容積の3項目において,定義上の基準範囲内で,ある閾値を超えた場合または以下の場合に総じて在院日数が長くなるDPCクラスタが3ケースみられた.

【結論】本研究は潜在的に臨床上有用な検査の判断値を探索するための方法を提案した.本実験により,在院日数に影響を及ぼす潜在的な判断値の候補が得られたことから,提案手法が探索的に潜在的臨床判断値を発見できることが示唆された.