[4-B-3-8] 臨床研究情報処理フレームワークにおける診療データの粒度調整
【目的】本研究は、臨床研究における情報処理フレームワークを提案する。フレームワークは、データ前処理(診療データの粒度調整)と分析(群間比較と予測・分類)で構成し、これらの2フェーズの試行を繰り返すことで前処理の良し悪しをノウハウとして蓄積する。本発表では、肺血栓塞栓症予防管理料の算定・非算定の予測モデル構築において、診療データの粒度調整の有効性を検証する。【対象と方法】予測モデルの目的変数は肺血栓塞栓症管理料の算定有無の2値とし、説明変数はKコード、検査・観察項目とする。宮崎大学医学部附属病院の2015・2016年の2年分の様式1、検査・観察項目の診療データを用いる。患者数は計21,529名である。粒度調整の対象は、手術術式のKコードおよび数値データの検査・観察項目とする。粒度調整は、Kコードには重心法による階層クラスタリングを適用し、検査・観察項目には3分割の等間隔区間による離散化を行う。予測モデルの良し悪しの検討には5つの評価指標を用いる。診療データの粒度調整の有効性は、粒度調整あり・なしの場合において、5つの分類器による評価指標の平均値を用いて実験的に比較する。分類器のパラメータはデフォルトとし、訓練・テストデータを7割・3割とする。【結果】粒度調整を実施すると、粒度調整しない場合と比較して、AUCが0.52%増加、寄与率がほとんど変化なく、Precisionが0.9%減少、Recallが1.68%増加、F-measureが0.87%増加した。【結語】本研究は、臨床研究における情報処理フレームワークを提案し、フレームワーク内の診療データの粒度調整について、その有効性を検証した。実験結果から、粒度調整をするとPrecisionの適合率は下がったが、それ以外の評価指標では向上がみられた。PrecisionとRecallの総合的指標のF-measureが向上し、AUCの増加から算定患者かどうかを判別する精度が向上したことから、粒度調整の有効性が本実験結果から示唆された。