Japan Association for Medical Informatics

[2-G-1-2] DPCデータを用いた決定木分析による乳がんと生活習慣病との関連について

坂本 千枝子1, 外山 比南子2, 斎藤 恵一1 (1.国際医療福祉大学, 2.医療データサイエンス研究所)

【目的】がんは現在我が国の死因第1位であり、喫煙や生活習慣病がそのリスク要因になっているとの報告も多い。そこで、主傷病や併存症の他、種々の情報を利用できるDPCデータを利用して2013年以来5大がん(肺、胃、肝、大腸、乳房)と喫煙や生活習慣病との関連を調べてきた。今回は乳がんを対象に同様の検討を試みる。【方法】2010-12年の4病院のDPCデータ18,448件の内訳は、複数回入院を1患者としてみると全体で14,780件になった。調査項目に欠落があるデータを除外すると、がん疾患は2,863件で乳がんは121件だった。がん疾患を乳がんとそれ以外のがんの2群に分類した。SPSSの決定木手法を用いて従属変数に乳がんの有無、独立変数に高血圧(HT)、高脂血症(HL)、2型糖尿病(DM)、肥満指数(BMI)、入院時年齢(歳)、喫煙の有無(喫煙)を置き、分岐がなくなるまで最も関連の強い第1分岐項目を独立変数から除いていく方法で分析した。【結果】第1分岐は歳で53以下、53超67以下、67超75以下、75超の4群に分かれ、乳がんの割合は歳が若いほど高かった。75超以外は第2分岐まであり、すべて喫煙だった。次に歳を除くと第1分岐は喫煙で喫煙有はHLで分岐し、HL有は無より乳がんの割合が約3倍だった。さらに喫煙を除くとDMで分岐し、DM無は有より乳がんの割合が約2倍だった。【考察】第1分岐の年齢群は乳がんの好発年齢が50代前半との報告を裏付ける。また、国際評価(IARC)では喫煙は乳がんのリスクとされていないが、HL有だと乳がんの割合が高くなったことは注目すべき点と考える。DMではリスク要因とされる報告と逆の結果となったが、治療薬が発がんリスクを抑えるとの報告もあり、調査が必要と考える。乳がんでは生活習慣病の関連がHTよりもHLやDMがより大きいことが示唆された。【結語】DPCデータを利用して決定木手法を用いた分析の結果、乳がん患者の年齢層や喫煙有とHL有の関連、DMとの関連が示唆された。