6:40 PM - 7:00 PM
[2P5-J-2-05] Semi-supervised learning based target gene selection for medical data
Keywords:feature selection, semi-supervised learning, human-in-the-loop
ある特定の分子の働きを阻害することにより病気の進行を抑制する治療法は分子標的治療と呼ばれ、主にがん治療の分野で用いられている。分子標的治療において新薬の開発を行うためには新たな標的遺伝子を発見することが必要となるが、標的となり得る遺伝子の候補を人間の手で網羅的に検証するには、多くのコストと時間を要する。そのため本研究では、遺伝子の発現量に関するデータに特徴選択を適用し、治療において重要だと考えられる遺伝子の特定を試みる。さらに、選択された遺伝子をケミカルスクリーニングなどによって人手で評価し、得られたデータを再び解析することで新たな標的遺伝子を発見することを目標とする。本研究における実験では、3つのデータセットを用いて新たな標的遺伝子の予測精度について検証を行った。この実験においては、特徴選択によって得られた特徴量がすべて真の標的遺伝子であることを仮定し、これらの特徴量を半教師あり学習を用いて識別できるかを評価した。その結果、いずれのデータセットを用いた場合も、訓練データの数の大小に関わらず、提案手法がベースラインの性能を上回ることが示された。