[3P-42] Towards protein interface prediction using SE(3)-Transformer
SE(3)-Transformerは,3次元点群から構築されるグラフのように,各ノードが座標情報を持つ連結グラフを入力として想定している深層学習モデルの一つである。このモデルでは,入力の3次元回転並進変換に対して同変性が保証されており,安定した特徴量計算が可能となっている。本研究ではこのモデルを蛋白質間相互作用部位のデータに適用する応用法について検討する。構造データは原子の3次元点群データであり,その意味ではこのモデルを用いることによる予測性能に与えるメリットは大きいと予想される一方,蛋白質の部分構造データのような点の数が比較的多い点群データで構成されている大規模なデータにおける実際の性能向上の可能性に関しては未知数である。データセットとして,PDBのBiological Unitとして登録されている蛋白質複合体構造を用い,複合体形成面の残基ペアの各周囲を切り出した部分構造ペアを正例,複合体形成面ではない構造表面残基の各周囲を切り出した部分構造ペアを負例としたデータを用いた。構造データは原子種及び座標値の点群であるが,ここに原子間の化学結合に基づきエッジを張ることでグラフ構造とする。入力は三次構造より空間的な距離制約で切り出した部分構造のため,非連結グラフとなる可能性があるが,これを解消するため非連結成分を接続する仮想エッジを張り,連結グラフとし入力する。入力はグラフのペアとなるため,モデルをSiamese Network(パラメータと重みを共有する2つのサブネットワークを用いる)に拡張した。