10:12 AM - 10:24 AM
[26M-am07S] Construction of prediction model for side effects development of cytarabine administration by genome information using machine learning
【背景】シタラビン(Ara-C)は急性白血病の治療薬として使用されている代謝拮抗薬であるが、皮膚障害や消化器障害、血液障害などの副作用が発現することがあるため、副作用発現を予測するマーカーを明らかにし副作用回避につなげることが重要である。本研究ではゲノム情報に着目し、ゲノムワイド関連解析(GWAS)によりAra-C投与による皮膚障害の発現に関連する遺伝子を抽出し、抽出した遺伝情報をもとに機械学習を用いて、より精度の高い予測モデルを構築することを目的とした。
【方法】徳島大学病院血液内科に入院した患者のうち、Ara-Cが投与された32名を対象にGWASを行った。アレイキットとしてIllumina Asian Screening Array-24Kitを用いた。GWASによって皮疹の発現と関連が示されたSNPsについて、さらに別個Ara-Cが投与された13名について遺伝子型を決定した。GWASで対象にした32名をstudy群、別個対象とした13名test群とし、機械学習を用いて副作用発現の予測モデルを構築した。アルゴリズムとしてRandom Forest(RF)、Support Vector Machine(SVM)、Naïve Bayes(NB)、Neural Network(NN)、K近傍法(KNN)を用い予測精度を比較した。
【結果・考察】GWASの結果から皮膚障害との関連を示した7 SNPsを抽出し、機械学習を行った。5種のモデルで比較したところ、KNNが最も高い予測精度を示した(正解率=76.92%、陽性反応的中率=50.0%、陰性反応的中率=88.89%、感度=66.67%、特異度=80.0%)。今後、他のアルゴリズムを用いたりSNPsの組み合わせを工夫したりすることで、より精度の高いモデルの構築が望まれる。
【方法】徳島大学病院血液内科に入院した患者のうち、Ara-Cが投与された32名を対象にGWASを行った。アレイキットとしてIllumina Asian Screening Array-24Kitを用いた。GWASによって皮疹の発現と関連が示されたSNPsについて、さらに別個Ara-Cが投与された13名について遺伝子型を決定した。GWASで対象にした32名をstudy群、別個対象とした13名test群とし、機械学習を用いて副作用発現の予測モデルを構築した。アルゴリズムとしてRandom Forest(RF)、Support Vector Machine(SVM)、Naïve Bayes(NB)、Neural Network(NN)、K近傍法(KNN)を用い予測精度を比較した。
【結果・考察】GWASの結果から皮膚障害との関連を示した7 SNPsを抽出し、機械学習を行った。5種のモデルで比較したところ、KNNが最も高い予測精度を示した(正解率=76.92%、陽性反応的中率=50.0%、陰性反応的中率=88.89%、感度=66.67%、特異度=80.0%)。今後、他のアルゴリズムを用いたりSNPsの組み合わせを工夫したりすることで、より精度の高いモデルの構築が望まれる。