Japan Association for Medical Informatics

[2-H-1-OP6-6] DPCデータと大阪府の地域がん登録データをリンケージした多施設研究―がん診断時のDPCデータでがん生命予後を予測できるか―

森島 敏隆1, 松本 吉史1, 小枝 伸行2, 島田 裕子3, 丸濱 勉4, 松木 大作5, 中田 佳世1, 宮代 勲1 (1.大阪国際がんセンター, 2.八尾市立病院, 3.独立行政法人国立病院機構 大阪南医療センター, 4.東住吉森本病院, 5.大阪府済生会吹田病院)

【背景】 多施設のDPCデータを利用する研究では同一人物の複数の病院にまたがったデータを名寄せできないという限界ゆえ、年単位のアウトカム予測モデルを構築することは困難である。そのため、DPCデータから得られる臨床情報が長期予後予測に使えるか否か不明であった。本研究の目的は、DPC データから得られる臨床情報だけでがん患者の生命予後を予測できるか否かを、長期予後情報を含むデータをリンケージすることによって調べることである。

【方法】 大阪府内の5つのがん診療拠点病院からDPCデータを、予後情報として大阪府の地域がん登録データを入手して、両データを患者レベルでリンケージした。研究対象者の選択基準を、2010年1月~2012年12月に胃、大腸、肺がんのいずれかで退院した18歳以上の患者とした。除外基準を上皮内がん、またはがん登録で生死を把握できなかった患者とした。Cox比例ハザード回帰モデルを部位別に構築するにあたって、がんの初回入院時のDPCデータの様式1から収集した性、退院時年齢、UICCステージ分類、入院時併存症(Charlson併存症指数に従ってスコア化)、緊急入院の有無、入院時バーセル指数、喫煙指数、Body Mass Indexを説明変数とした。がん登録から収集した全死因死亡を事象、がん診断日から死亡日または最終生存確認日までの日数を生存時間とした。モデルの予後予測の識別力をHarrellのC統計量で評価した。この指標は0.5~1.0の値をとり、0.7~0.8で及第、0.8以上で優れた識別力を有すると判断される。

【結果】 研究対象者は胃、大腸、肺がんの順に(以下、同じ)953、793、760人、死亡者は408、312、498人、生存時間の中央値は1495、1548、602日だった。C統計量は0.84、0.78、0.76だった。

【結論】 どの部位においても予後予測能は及第以上であった。初回入院時のDPCデータから得られる臨床情報だけでもがん患者の予後予測がある程度可能であることがわかった。