[2Xin5-01] 大規模タンパク質データベースに基づくBERTを用いたペプチド結合予測と予測残基対の可視化
キーワード:ペプチド結合予測、アミノ酸配列、BERT、事前学習
ワクチン開発において,B細胞エピトープ予測と,MHCIIに対するペプチドの結合予測はいずれも重要な予測タスクである.B細胞エピトープを予測することは,抗原に特異的な抗体産生を誘導するワクチンの設計・開発のために有益である.一方,感染の重症度を低減するT細胞を活性化するワクチン開発に対しても,MHCIIに対するペプチドの結合を予測する必要がある.これら予測タスクに対する機械学習を用いた従来手法には,以下の二つの課題がある.一点目は離れたアミノ酸間の複雑な依存関係を捉えていない課題,二点目は学習データが不十分な場合に精度が低いという課題である.これらの課題に対処するために,本稿では大規模タンパク質データベースにより事前学習した,自己注意機構を持つBERTモデルを用いた手法を提案する.実験の結果,提案手法はB細胞エピトープ予測,MHCIIに対するペプチドの結合予測の実験で従来よりも高い性能を達成した.また,生物学的観点からタンパク質の構造と機能に着目し,提案手法から導出された自己注意の可視化と分析を行う.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。