10:30 〜 12:10
[3Rin2-49] サンプル混合度を考慮した遺伝子発現量のがんバイオマーカー探索
キーワード:バイオインフォマティクス、遺伝子発現、特徴量選択
がんの診断等において,未知のサンプルが癌であるか正常細胞であるかを判定するためのバイオマーカーとして遺伝子発現データが使われる.ここで,学習データのうち「癌」というラベルは100%正しいものでなく,採取時のテクニカルな理由で正常組織が混在してしまう場合がある.このとき,がんと正常細胞の中間的な振る舞いが観察される組織サンプルであるにもかかわらず、がん組織という不正確な教師ラベルが付与されたデータが与えられた状況となり、癌と正常組織を区別できるバイオマーカーを正しく決定することが困難となる.ここではサンプルの純度および状態を推定し,正しくバイオマーカーを探索する方法を提案する.人工データにおいて混合サンプルを作成し,混合サンプルの70%を同定できた.本方法にて新規バイオマーカーを決定できることが期待できる。