The 21st Annual Meeting of the Protein Science Society of Japan

Presentation information

Poster Session

[2P-1] Poster 2 (2P-01ー2P-37)

Thu. Jun 17, 2021 2:45 PM - 4:45 PM Poster 1

[2P-35] Accelerating Protein Improvement Methods Using Machine Learning

Yoichi Kurumida, Yutaka Saito, Tomoshi Kameda (AIRC, AIST)

機械学習はタンパク質の改良に有用な手段の一つであり、次のような流れで機械学習が使用されてきている。まず対象タンパク質の少数の変異体を作成し、改良したい物性値を測定する。そしてそれらを学習データとして機械学習を行い、対象の変異箇所における全変異体(4重変異体なら204=160,000変異体)の物性値を予測する。使用する学習データによって予測精度が変化するため、どのような変異体群の物性値を学習データとするか、その選択は重要である。Wittmannらはシミュレーション(Triad)を用いて、熱安定性の高い変異体群の目的物性値(この研究では抗原への結合力)を学習データとして機械学習による予測を行えば、ランダムに変異体群を選び学習したときに比べて、より高い物性値を持つ変異体を取得できる、と報告した(2020, bioRxiv)。しかし、通常熱安定性予測には多くの時間やコストがかかる。また、予測精度が高い手法は、多くの計算コストを必要とする。
そこで本研究では、結合力予測だけでなく、熱安定性予測にも機械学習を組み合わせることで、低コストで高速に高機能変異体を予測できる方法を開発した。検証のため、Wuらにより報告された(2016, eLife) GB1タンパク質の4重変異体(全160,000変異体)に対して計算を行った。その結果、既存の方法と比較して本提案手法は同程度の予測精度で計算速度が約97倍高速となることがわかり、本手法の有用性が確認できた。