[3P-35] Nonlinear-dimensionality reduction analysis of protein dynamics
N粒子から成る蛋白質の自由度は3N-6であり、即ち蛋白質の動態は超高次元空間上に分布する関数として表現される。しかしながら、蛋白質の構造変化を支配する自由度は多くの場合3N-6よりもずっと少なく、数個の特徴量で表現可能である。このように蛋白質動態を少数次元に削減して表現することは動態の直観的な理解に極めて重要である。蛋白質動態の次元削減手法にはPrincipal Component Analysis (PCA)やtime-lagged Independent Component Analysis (tICA)がよく用いられる。これらは計算コストが低い線形な手法でありながら多くの蛋白質の動態をよく記述できることが知られているものの、例えばフォールディング/アンフォールディングのような複雑な動態に対してはあまり有効でない。一方で、t-distributed Stochastic Neighborhood Embedding (t-SNE)に代表される非線型な手法は複雑な動態にも適用できると期待されるものの、非線型な手法では一般にデータ量に対して指数関数的に計算量が増加するため、数万から数十万のサンプリングされた構造を扱うMD計算への応用が現実的でないという問題点があった。2018年に発表された非線型次元削減手法UMAPはt-SNEと同等以上の性能を有しながら極めて高速に動作するという利点を持つ。そこで本研究ではUMAPの蛋白質動態次元削減への応用可能性を検討するべく複数のテスト系によるMDシミュレーションとトラジェクトリー解析を行った。本発表では解析結果を踏まえ、他の手法と比較したUMAPの性能について議論する。