16:20 〜 16:40
[1F4-GS-10-05] 化学合成における構造生成のための大規模言語モデルの追加事前学習
キーワード:化合物構造生成、計算化学、大規模言語モデル
創薬の領域で、医薬品の発見を目的として、Deep learningを活用した化合物の構造生成モデルに関する研究が進められている。構造生成モデルは、構造式を文字列として扱うものや、原子間の結合をグラフ構造として取り扱うもの、原子の位置や結合を3次元的な構造として取り扱うものなど多岐にわたる。いずれのモデルでも化合物に対する所望の特性を条件として構造を生成するが、近年のLarge Language Model (LLM)の大きな成功から、文字列ベースの手法においては、自然言語を用いた柔軟な指示の下で、化合物の生成や編集を実現できることが期待される。本研究では、LLMに事前追加学習を施すことで、LLMが構造生成モデルとして機能し、創薬での活用が期待できることを示す。実験では、LLaMA-2-7Bをベースモデルとして、低分子化合物を追加事前学習させることで、構造生成モデルを作成した。本研究の提案モデルが言語モデルとしての機能を保持しつつ、構造生成に特化したグラフベースのモデルであるJT-VAEに匹敵する性能を達成できることをMOSESベンチマークを用いた評価により示す。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。