Japan Association for Medical Informatics

[3-L-3-PP9-3] 血液検査データに対する判別分析を用いた予測因子候補の抽出

永田 夏海1, 松井 藤五郎1,2, 平手 裕市1 (1.中部大学 生命健康科学部 臨床工学科, 2.中部大学 工学部 情報工学科)

1.はじめに

 本研究では,医学的知識を用いずに血液検査データの全検査項目を対象として判別分析を行うことによって,医学的研究における予測因子の候補を抽出する方法について検討する.



2.方法

 本研究は名古屋掖済会病院倫理審査委員会の承認を得ている(No. 2016-030).

 本研究では,アウトカムの例として死亡を対象に,死亡直近の検査結果を1,そうでない結果を0として従属変数とした.独立変数は,Mann-WhitneyのU検定にて帰無仮説が棄却された41個の検査項目を用いた.ステップワイズ法を用いてさらに変数を選択し,選択された変数を用いて判別関数を求めた.



3.結果

 選択された41個の検査項目を独立変数の候補としてステップワイズ法を行った結果,pH, AGAP (Anion GAP), LD/AST (Lactate Dehydrogenase / Aspartate Aminotransferase), 総蛋白,Lymphocyte, Eosinophilの6項目を独立変数として用いた判別関数が得られた.

 交差確認の結果,得られた判別関数の精度は90.1%と高いものであった.



4.考察

 ステップワイズ法によって選択された6項目の中で,2番目のステップにおいてpHとの組み合わせでAGAPが採用されたことは,pH低値となるアシドーシスの鑑別診断でAGAPが有用となる臨床的意義に一致しており,興味深いものである.



5.結論

 本論文では,医学的研究における予測因子の候補を抽出するために,血液検査データに対して判別分析を行う方法について検討した.アウトカムの例として死亡を対象に,検査結果を死亡直近の結果とそれ以外の結果に分け,Mann-WhitneyのU検定により帰無仮説が棄却された検査項目を独立変数の候補とし,ステップワイズ法を用いた判別分析によって独立変数を選択した.

 その結果,死亡直近を90.1%の精度で判別できる判別関数を得ることができた.この判別関数には6つの検査項目が独立変数として用いられ,これらの中には臨床的意義に一致したものも含まれていた.このことから,医学的知識を用いずにデータマイニングを行うことによって,医学的研究における予測因子の候補を抽出できることが示唆された.