一般社団法人 日本医療情報学会

[2-F-3-OP10-2] 高額医療費の要因分析に適したデータマイニング手法に関する研究

村永 文学1, 岩穴口 孝1, 宇都 由美子2, 熊本 一朗2 (1.鹿児島大学病院 医療情報部, 2.鹿児島大学大学院医歯学総合研究科 医療システム情報学)

【目的】病院データウェアハウスに蓄積されたデータから、医療コストに影響を与える因子を発見・可視化する場合に最適なデータマイニング手法について比較調査する。
【方法】
2011年1月~2015年12月の間に院内がん登録で肝細胞癌の初回入院・初回治療として登録された患者を対象とし、当院の病院データウェアハウスから医療コスト情報、院内がん登録システムからがん登録情報、医事会計システムから会計情報、オーダリングシステムから検査結果情報を抽出し、全て匿名化してデータマートに格納した。
高コストとなる要因の分析について、クラスタ分析、アソシエーション分析、ベイジアンネットワーク分析、ニューラルネットワーク分析等の手法の有用性について評価を行った。
【結果及び考察】患者数は、365名であった。医療コストデータは約62万行、医療コスト費目名のバリエーションは3642種であった。まず、性別,在院日数,がんのステージ,年齢,総医療費及び一日当たりの医療費について、k-means法によるクラスタ分析による特徴群の抽出を試みたが、明らかな高コスト要因は発見できなかった。次に一日当たりの医療費が大きい順に、高・中・低コスト群に3分割し、高コスト群を医療コスト費目名のみから判別可能であるか調査した。アソシエーション分析・及びベイジアンネットワークは、メモリオーバーフローの為分析不可能であった。
ニューラルネットワークでは、機械学習用274件と、評価用91件に症例を分割し、機械学習後、評価した。その結果、中間ニューロン数4の場合に約87%の高コスト群を判別できた。中間ニューロンが増えると処理時間は倍増するが、精度は上がらなかった。高コスト群と学習したニューロンの重みについて分析した結果、試行の度にニューロンの重みが関連する費目名が変化することが判明した。学習を分析を繰り返し、要因となる費目名を絞ることができた。