11:45 〜 12:00
[HDS11-10] 災害・事故時の緊急対応における活性炭の適用可能性 ― AI機械学習による吸着性能予測
キーワード:活性炭吸着性能予測、化学物質流出、AI機械学習、吸着係数 (log K)、災害・事故時のリスク管理、緊急時対応
水道水源における化学物質流出事故は、取水や浄水の供給停止を引き起こし、迅速な除去手法の確立が求められる。活性炭は、多孔質かつ高表面積を有する吸着材として、緊急事故時等に河川に流出した化学物質の除去のために広く利用されているが、吸着能は分子構造や細孔特性に依存するうえ、全ての化学物質について十分なデータは、まだ得られていない。しかし、活性炭吸着能の実験データがない化学物質について、逐一実験を行うことは時間とコストがかかるため、今後、自然災害等による流出事故が起きた際に即座に適切な対応ができない可能性がある。また、活性炭の分子構造は不規則であり、従来の物理化学的モデルでは精度の高い定量予測が難しい。そこで、本研究では、活性炭への化学物質の吸着係数(log K)を予測するAIモデルを構築し、評価することを目的とした。
まず、機械学習ソフトウェアM-EVO (HPC Systems Inc.) を用い、グラフ畳み込みネットワーク(GCN)による深層学習モデルを構築した。データとして、安部 (1986) の実測データをもとに、活性炭吸着文献の101化合物のうち分子構造が明確である95化合物を使用し、学習セット(85化合物)とテストセット(10化合物)に分割し、段階的な学習精度の評価を実施した。学習セットとテストセットの選別においては、95化合物の中から、学習データとして抽出した化学物質の性状が均一になるよう、ランダムな選別を5回繰り返した。そして、テストセットの10化合物で、文献値(安部,1986)の吸着係数が良好に予測できていることを確認した(R2値:0.895)。
この学習モデルを使って、Environmental Protection Agency (以下EPA)(1980) の実測データのうち、安部 (1986)と実験条件が類似する11物質を選出し、それらの活性炭への吸着係数の予測を行った。また、活性炭への化学物質の吸着係数の実験データの文献値(EPA,1980)と予測値の比較を行い、それらの相関について、決定係数を算出し、誤差分布を解析した。
その結果、吸着係数(log K)の文献値と機械学習モデル予測値のR2値は 0.902であり、高い相関が確認された。また、二乗平均平方根偏差 (RMSD) は0.534 であり、モデルの予測値は全体的に文献値と整合していることが示された。中でも芳香族炭化水素(ベンゼン、トルエン、p-キシレン、スチレン、エチルベンゼン)は良好に再現されたが、芳香族化合物の中で4,4'-メチレン-ビス (文献値 2.28、予測値 3.43)、4-アミノビフェニル (文献値 2.30、予測値 3.14)、ナフタレン (文献値 2.12、予測値 2.81)は吸着係数が0.7~1.2ほど、予測値が実測値より過大となる傾向があった。この原因として、学習に用いた実験データが他の実験値と乖離しているものが含まれている可能性があることと、GCNが局所的な分子構造を学習できている一方で、立体的サイズや相互作用の影響を一部考慮できていない可能性が示唆された。今後は、新たな実験を行い、モデルの予測値と実測値の整合性を検証する必要がある。また、特徴量の改良やデータの拡充を進め、より精度の高いモデル構築を目指す。
まず、機械学習ソフトウェアM-EVO (HPC Systems Inc.) を用い、グラフ畳み込みネットワーク(GCN)による深層学習モデルを構築した。データとして、安部 (1986) の実測データをもとに、活性炭吸着文献の101化合物のうち分子構造が明確である95化合物を使用し、学習セット(85化合物)とテストセット(10化合物)に分割し、段階的な学習精度の評価を実施した。学習セットとテストセットの選別においては、95化合物の中から、学習データとして抽出した化学物質の性状が均一になるよう、ランダムな選別を5回繰り返した。そして、テストセットの10化合物で、文献値(安部,1986)の吸着係数が良好に予測できていることを確認した(R2値:0.895)。
この学習モデルを使って、Environmental Protection Agency (以下EPA)(1980) の実測データのうち、安部 (1986)と実験条件が類似する11物質を選出し、それらの活性炭への吸着係数の予測を行った。また、活性炭への化学物質の吸着係数の実験データの文献値(EPA,1980)と予測値の比較を行い、それらの相関について、決定係数を算出し、誤差分布を解析した。
その結果、吸着係数(log K)の文献値と機械学習モデル予測値のR2値は 0.902であり、高い相関が確認された。また、二乗平均平方根偏差 (RMSD) は0.534 であり、モデルの予測値は全体的に文献値と整合していることが示された。中でも芳香族炭化水素(ベンゼン、トルエン、p-キシレン、スチレン、エチルベンゼン)は良好に再現されたが、芳香族化合物の中で4,4'-メチレン-ビス (文献値 2.28、予測値 3.43)、4-アミノビフェニル (文献値 2.30、予測値 3.14)、ナフタレン (文献値 2.12、予測値 2.81)は吸着係数が0.7~1.2ほど、予測値が実測値より過大となる傾向があった。この原因として、学習に用いた実験データが他の実験値と乖離しているものが含まれている可能性があることと、GCNが局所的な分子構造を学習できている一方で、立体的サイズや相互作用の影響を一部考慮できていない可能性が示唆された。今後は、新たな実験を行い、モデルの予測値と実測値の整合性を検証する必要がある。また、特徴量の改良やデータの拡充を進め、より精度の高いモデル構築を目指す。
