13:00 〜 13:20
[4C1-OS-27a-04] 予測因子候補を抽出するための血液検査データに対する包括的な分類分析
キーワード:データマイニング、機械学習、医療
本研究では、一般的な機械学習の手法を網羅的に用いて血液検査データを分析する手法を提案する。
提案手法は、ステップワイズ変数増加法において新しい変数を選択するたびに前処理を行い、モデルを評価するもので、本論文ではこれを患者指向ステップワイズ法と呼ぶ。
患者指向ステップワイズ法の中で行う前処理として、患者ごとに正例と負例を対にしてサンプリングする患者サンプリング、正例から推定されたパラメーターを用いて正規分布に近づける1クラスBox-Cox変換、正例の平均と不偏標準偏差に基づく1クラス標準化を提案する。
また、選択された説明変数の評価方法として、患者ごとに検証データを作成するリーブ・ワン・ペイシェント・アウト・クロス・バリデーション (LOPOCV) を提案する。
実際の血液検査データを用いた実験を行い、提案手法は分類精度が高いモデルを学習し、予測因子の候補を抽出できることを確認した。
提案手法は、ステップワイズ変数増加法において新しい変数を選択するたびに前処理を行い、モデルを評価するもので、本論文ではこれを患者指向ステップワイズ法と呼ぶ。
患者指向ステップワイズ法の中で行う前処理として、患者ごとに正例と負例を対にしてサンプリングする患者サンプリング、正例から推定されたパラメーターを用いて正規分布に近づける1クラスBox-Cox変換、正例の平均と不偏標準偏差に基づく1クラス標準化を提案する。
また、選択された説明変数の評価方法として、患者ごとに検証データを作成するリーブ・ワン・ペイシェント・アウト・クロス・バリデーション (LOPOCV) を提案する。
実際の血液検査データを用いた実験を行い、提案手法は分類精度が高いモデルを学習し、予測因子の候補を抽出できることを確認した。