13:15 〜 13:30
[R17-O-2] 機械学習を用いた地盤の特徴量に基づく地層対比手法の検討
キーワード:機械学習、ボーリングデータ、地層対比、3次元地質モデル
地下の地質構造を3次元で表すモデル(3次元地質モデル)は,インフラ整備やハザードマップ作成に必要不可欠な空間情報のひとつである.建築物や道路が地表のほとんどを覆う都市部では,地下数十メートルを対象とした3次元地質モデルを作成する場合,地下の状態を直接観察した結果であるボーリングデータについて地層の対比処理を行い,その結果を基に地質構造を推定することが多い(納谷ほか, 2018,2021など).しかし,地層の対比には堆積学や層序学等に関する高度な知識と技術が必要であり,その作業には膨大な時間がかかるのが一般的である.他方,近年,公共工事で得られた多数のボーリングデータが,国や自治体によって標準的なデータ形式(国土交通省,2016)で収集・管理されるようになってきた.この動きは今後も継続すると考えられ,ボーリングデータにおける地層対比を迅速かつ正確に実施する技術を開発できれば,従来よりも詳細な3次元地質モデルの作成につながると期待できる.本研究では,この技術開発の第一段階として,機械学習を利用してボーリングデータに記載された情報から地層名を予測する方法について検討した.
ボーリングデータにおける地層の対比は,地盤の特徴を定量的に表した値(特徴量)を入力データ,地層名ラベルを出力データとする教師あり学習の分類問題と考えられる.ここでは,利用するボーリングデータは鉛直方向に掘削して得られたものという前提のもと,ボーリングデータから鉛直方向について等間隔に抽出した地盤の特徴量を機械学習に用いる.地盤の特徴量には,標高,主となる岩石・土質,混合物の種類とその割合,標準貫入試験結果(N値)を用いる.混合物の種類とその割合については,岩石・土質名に記載される頻度の高い,泥,シルト,砂,礫,有機質土,火山灰,貝殻を対象とし,岩石・土質名から導く.
上記の特徴量を利用した機械学習による地層対比の有効性を調べるために,代表的な教師あり分類アルゴリズムおよび5層から構成されるニューラルネットワークそれぞれを用いて,10種類の特徴量から4種類の地層名ラベルを予測するテスト計算を実施した.教師あり分類アルゴリズムには,サポートベクターマシン,決定木(ランダムフォレスト),k近傍法を用いた.また,テスト計算用の特徴量および地層名ラベルのデータセット作成には,納谷ほか(2018)で利用された1,654本のボーリングデータおよびそれらに関する地層の対比データを用いた.テスト計算では,全ボーリングデータのうち1,300本のボーリングデータから抽出した特徴量を学習データ,残りの354本から抽出した特徴量を評価データとした.それぞれの機械学習から得られる地層対比モデルの評価には,交差検証とHold-out法を利用した.地層対比モデルの評価指標には,評価データに対する正解率とCohen(1960)によるkappa係数を利用した.交差検証では,学習データを東側に分布するものから順に5グループに等分し,4グループを訓練データ,1グループを検証データとする5分割交差検証を実施した.その結果,いずれの分類手法においても,評価データに対する正解率は85%以上,kappa係数は0.77以上を示した.Hold-out法では,学習データのうち70%を訓練データ,30%を検証データとして地層対比モデルを作成した.ただし,検証データはランダムに選択した.その結果,評価データに対する正解率およびkappa係数は,交差検証の結果と同様の値となった.
現時点では,機械学習に入力する地盤の特徴量はそれぞれ,ボーリングデータのある一点に焦点をあてたものとなっており,その周辺における特徴量についての情報を含まない.しかし,地層は広がりをもつものであるため,周辺の特徴量を効果的に含ませることができれば,地層対比の精度を向上できると考える.今後は,ボーリングデータから抽出する特徴量の種類について検討を進めるとともに,周辺の特徴量を活用する方法についても検討していく予定である.本研究はJSPS科研費JP19K04004の助成を受けたものである.
文献
Cohen, J., 1960, A Coefficient of Agreement for Nominal Scales. Educational and Psychological Measurement, 20, 37–46.
国土交通省,2016,地質・土質調査成果電子納品要領.国土交通省,50p.
納谷ほか,2018,都市域の地質地盤図「千葉県北部地域」説明書.産総研地質調査総合センター,55p.
納谷ほか,2021,都市域の地質地盤図「東京都区部」説明書.産総研地質調査総合センター,82p.
ボーリングデータにおける地層の対比は,地盤の特徴を定量的に表した値(特徴量)を入力データ,地層名ラベルを出力データとする教師あり学習の分類問題と考えられる.ここでは,利用するボーリングデータは鉛直方向に掘削して得られたものという前提のもと,ボーリングデータから鉛直方向について等間隔に抽出した地盤の特徴量を機械学習に用いる.地盤の特徴量には,標高,主となる岩石・土質,混合物の種類とその割合,標準貫入試験結果(N値)を用いる.混合物の種類とその割合については,岩石・土質名に記載される頻度の高い,泥,シルト,砂,礫,有機質土,火山灰,貝殻を対象とし,岩石・土質名から導く.
上記の特徴量を利用した機械学習による地層対比の有効性を調べるために,代表的な教師あり分類アルゴリズムおよび5層から構成されるニューラルネットワークそれぞれを用いて,10種類の特徴量から4種類の地層名ラベルを予測するテスト計算を実施した.教師あり分類アルゴリズムには,サポートベクターマシン,決定木(ランダムフォレスト),k近傍法を用いた.また,テスト計算用の特徴量および地層名ラベルのデータセット作成には,納谷ほか(2018)で利用された1,654本のボーリングデータおよびそれらに関する地層の対比データを用いた.テスト計算では,全ボーリングデータのうち1,300本のボーリングデータから抽出した特徴量を学習データ,残りの354本から抽出した特徴量を評価データとした.それぞれの機械学習から得られる地層対比モデルの評価には,交差検証とHold-out法を利用した.地層対比モデルの評価指標には,評価データに対する正解率とCohen(1960)によるkappa係数を利用した.交差検証では,学習データを東側に分布するものから順に5グループに等分し,4グループを訓練データ,1グループを検証データとする5分割交差検証を実施した.その結果,いずれの分類手法においても,評価データに対する正解率は85%以上,kappa係数は0.77以上を示した.Hold-out法では,学習データのうち70%を訓練データ,30%を検証データとして地層対比モデルを作成した.ただし,検証データはランダムに選択した.その結果,評価データに対する正解率およびkappa係数は,交差検証の結果と同様の値となった.
現時点では,機械学習に入力する地盤の特徴量はそれぞれ,ボーリングデータのある一点に焦点をあてたものとなっており,その周辺における特徴量についての情報を含まない.しかし,地層は広がりをもつものであるため,周辺の特徴量を効果的に含ませることができれば,地層対比の精度を向上できると考える.今後は,ボーリングデータから抽出する特徴量の種類について検討を進めるとともに,周辺の特徴量を活用する方法についても検討していく予定である.本研究はJSPS科研費JP19K04004の助成を受けたものである.
文献
Cohen, J., 1960, A Coefficient of Agreement for Nominal Scales. Educational and Psychological Measurement, 20, 37–46.
国土交通省,2016,地質・土質調査成果電子納品要領.国土交通省,50p.
納谷ほか,2018,都市域の地質地盤図「千葉県北部地域」説明書.産総研地質調査総合センター,55p.
納谷ほか,2021,都市域の地質地盤図「東京都区部」説明書.産総研地質調査総合センター,82p.