[4-G-4-08] 実診療データにおける検査欠測は医師の臨床判断を反映しているか?
clinical decision, missing value, imputation, clinical examination, serum protein electrophoresis
背景と目的
診療に基づくReal World Dataの活用が期待されているが、検査データに存在する欠測が大きな問題となる。従来、欠測は無作為に発生すると仮定して欠測値を推定する方法が考えられているが、実臨床においては「異常を疑う情報が無ければ検査を行わない」という医師の判断の必然的な結果と考えられ、多数のデータを統合しても同じパターンの欠測を含み、網羅性を満たすビッグデータは得られない可能性がある。このため「異常を疑う情報が無ければ検査を行わない」という仮定に基づいた欠測値推定方法が必要である。本研究ではこの仮定の妥当性を検証する。
方法
高知大学医学部附属病院のHISに蓄積された蛋白電気泳動検査(SPEP)の波形情報、血液検査結果、年齢・性別を用い、SPEPと同日に血液検査が行われている検査群を学習・評価データとしてSPEP波形から血液検査の陽性を推定するモデルを構築、PFTは行われているが、血液検査は行われていない欠測群に適用して欠測検査の陽性を推定、両群の検査陽性率を求めて比較した。推測モデルとしては、先行研究で最も成績の良かった勾配ブースティング決定木(GBDT)を用いた。対象とした血液検査は、CRP,WBC,HbA1c,D-Bill,γGT,BUN、リウマチ因子(RF)である。
結果
CRP,γGT,BUNについて、両群の陽性率に差は見られず、WBC,HbA1c,D-Bill,RFについては欠測群の陽性率の方が低かった。
考察
差のなかった検査については、実施率が90%前後で、ルーチン的に実施されているためと考えられる。欠測群の陽性率の方が低かった検査については。WBC以外の実施率は65%から16%であり、異常が疑われる場合のみ実施されたと考えられ、WBCについては異常の予測が容易であることが反映した結果であり、これらは仮定の正しさを示すと考えられる。
診療に基づくReal World Dataの活用が期待されているが、検査データに存在する欠測が大きな問題となる。従来、欠測は無作為に発生すると仮定して欠測値を推定する方法が考えられているが、実臨床においては「異常を疑う情報が無ければ検査を行わない」という医師の判断の必然的な結果と考えられ、多数のデータを統合しても同じパターンの欠測を含み、網羅性を満たすビッグデータは得られない可能性がある。このため「異常を疑う情報が無ければ検査を行わない」という仮定に基づいた欠測値推定方法が必要である。本研究ではこの仮定の妥当性を検証する。
方法
高知大学医学部附属病院のHISに蓄積された蛋白電気泳動検査(SPEP)の波形情報、血液検査結果、年齢・性別を用い、SPEPと同日に血液検査が行われている検査群を学習・評価データとしてSPEP波形から血液検査の陽性を推定するモデルを構築、PFTは行われているが、血液検査は行われていない欠測群に適用して欠測検査の陽性を推定、両群の検査陽性率を求めて比較した。推測モデルとしては、先行研究で最も成績の良かった勾配ブースティング決定木(GBDT)を用いた。対象とした血液検査は、CRP,WBC,HbA1c,D-Bill,γGT,BUN、リウマチ因子(RF)である。
結果
CRP,γGT,BUNについて、両群の陽性率に差は見られず、WBC,HbA1c,D-Bill,RFについては欠測群の陽性率の方が低かった。
考察
差のなかった検査については、実施率が90%前後で、ルーチン的に実施されているためと考えられる。欠測群の陽性率の方が低かった検査については。WBC以外の実施率は65%から16%であり、異常が疑われる場合のみ実施されたと考えられ、WBCについては異常の予測が容易であることが反映した結果であり、これらは仮定の正しさを示すと考えられる。