[ACG36-P04] 富士川周辺地域における素因と誘因を考慮した機械学習による土砂災害危険度推定
キーワード:土砂災害、ニューラルネットワーク、クラスター分類、素因、誘因
静岡県・山梨県・長野県を流れる富士川流域には急峻な山地や糸魚川・静岡構造線が含まれ,ひとたび大雨が発生すると土砂災害により多くの被害が発生しうる.それに対するソフトウェア対策として,気象庁と県が連携して「土砂災害警戒情報システム」を運用している.しかし現業の土砂災害警戒情報システムでは,誘因(直接災害をもたらす動的な発生要因)については気象レーダーに基づく詳細な降雨情報を導入している一方,素因(災害の発生・拡大に関する潜在的な環境要因)である地形・地質情報を直接的に考慮することができない.土砂災害ソフトウェア対策の信頼性を向上し迅速な避難につなげるためには,素因と誘因の両方を考慮した土砂災害危険度推定手法を開発し,より実情を反映した警戒情報を提供する必要がある.
以上を踏まえて本研究では、機械学習手法であるニューラルネットワークとk-means法を用いて,富士川周辺地域(山梨県及び静岡県)における素因と誘因を考慮した土砂災害危険度推定手法を構築する.危険度推定の対象とするのは現業の土砂災害警戒情報システムと同様に表層崩壊(土石流と大規模な崖崩れ)である.
本研究では手法の学習及び検証において,山梨・静岡両県で多くの土砂災害をもたらした2001年台風15号(9月21日)と台風12号(9月2~4日)の事例をそれぞれ用いた.本研究では土砂災害の素因情報を得るために国土数値情報の標高・傾斜度3次メッシュ,土地利用3次メッシュ,土地分類メッシュ(表層地質)を用い,山梨・静岡両県について空間解像度約1kmのデータを抽出した.誘因情報としては,気象庁が提供する全国合成レーダーGPV(空間解像度約1km)より前60分雨量データを抽出した.また,全国合成レーダーGPVを3段タンクモデル(土砂災害警戒情報システムと同様)に入力して土壌雨量指数を算出し,併せて使用した.教師データについては,山梨県・静岡県から提供された災害報告を基に土砂災害発生の有無(土砂災害の発生なし:0,発生あり:1)について空間解像度約1kmのデータを作成した.
本研究ではまずニューラルネットワークのみを用いて,誘因(2要素)と素因(30要素)を入力とし,0(土砂災害の危険低)~1(土砂災害の危険大)の値を出力する2クラス識別問題として手法を構築した.学習過程について誤差(損失関数)の推移を検討したが,学習を進めても誤差が減少せず,ニューラルネットワークの出力分布については全地域について0に近い値となり,意図したとおりに学習が進まなかった.これは、大量の土砂災害なし(0)のデータを教師データとして与えた結果,出力値を0に近い数値にするように学習が行われたことが原因と考えられる.また,入力データに対してアンダーサンプリングを適用したところ,誤差は顕著に減少せず,ニューラルネットワーク出力分布については、全地域で1に近い値となり,やはり意図したとおりに学習が進まない結果となった.
これらの問題を踏まえ,各1kmメッシュに0~1までの危険度を設定し,それを中間層2層のニューラルネットワークの教師データとして用いる回帰問題として手法を再構築した.各セルの危険度については,k-means法を用いて入力データを40クラスターに分類したうえで,各クラスター内の災害発生セル割合に基づき設定した.さらにk-means法によるクラスター分類の際に素因と誘因の重みづけを対等にするために,入力データを誘因2項目(前60分積算降水量,土壌雨量指数)と素因2項目(斜面勾配,断層の有無)とした.その結果,学習過程(2011年9月21日15時のデータを使用)ではepoch数が進むにつれて誤差が減少し,ニューラルネットワーク出力分布では実際に土石流が発生した地点において高い値が出力され,意図したとおりに学習が進むようになった.また,検証過程(2011年9月3日11時のデータを使用)においてもepoch数が進むにつれて一旦誤差が上昇するがその後徐々に減少し,若干過学習傾向にあるが検証用データに対してもネットワーク適用可能と考えられた.また,検証用データを入力したニューラルネットワーク出力分布では,実際に土石流が発生した地点で高い値を示した.
このことから,本研究で構築した手法を改良していくことで,その出力分布を土砂災害危険度として活用できる可能性が示唆された.また,手法構築に当たっては入力データの十分な選別,適切な問題設定,誘因と素因の重みづけを揃えることが重要であることが示唆された.本研究では特定の土砂災害発生事例を用いて学習と検証を行ったが,今後は学習過程により多くの事例を用いるよう改良を行う必要がある.
以上を踏まえて本研究では、機械学習手法であるニューラルネットワークとk-means法を用いて,富士川周辺地域(山梨県及び静岡県)における素因と誘因を考慮した土砂災害危険度推定手法を構築する.危険度推定の対象とするのは現業の土砂災害警戒情報システムと同様に表層崩壊(土石流と大規模な崖崩れ)である.
本研究では手法の学習及び検証において,山梨・静岡両県で多くの土砂災害をもたらした2001年台風15号(9月21日)と台風12号(9月2~4日)の事例をそれぞれ用いた.本研究では土砂災害の素因情報を得るために国土数値情報の標高・傾斜度3次メッシュ,土地利用3次メッシュ,土地分類メッシュ(表層地質)を用い,山梨・静岡両県について空間解像度約1kmのデータを抽出した.誘因情報としては,気象庁が提供する全国合成レーダーGPV(空間解像度約1km)より前60分雨量データを抽出した.また,全国合成レーダーGPVを3段タンクモデル(土砂災害警戒情報システムと同様)に入力して土壌雨量指数を算出し,併せて使用した.教師データについては,山梨県・静岡県から提供された災害報告を基に土砂災害発生の有無(土砂災害の発生なし:0,発生あり:1)について空間解像度約1kmのデータを作成した.
本研究ではまずニューラルネットワークのみを用いて,誘因(2要素)と素因(30要素)を入力とし,0(土砂災害の危険低)~1(土砂災害の危険大)の値を出力する2クラス識別問題として手法を構築した.学習過程について誤差(損失関数)の推移を検討したが,学習を進めても誤差が減少せず,ニューラルネットワークの出力分布については全地域について0に近い値となり,意図したとおりに学習が進まなかった.これは、大量の土砂災害なし(0)のデータを教師データとして与えた結果,出力値を0に近い数値にするように学習が行われたことが原因と考えられる.また,入力データに対してアンダーサンプリングを適用したところ,誤差は顕著に減少せず,ニューラルネットワーク出力分布については、全地域で1に近い値となり,やはり意図したとおりに学習が進まない結果となった.
これらの問題を踏まえ,各1kmメッシュに0~1までの危険度を設定し,それを中間層2層のニューラルネットワークの教師データとして用いる回帰問題として手法を再構築した.各セルの危険度については,k-means法を用いて入力データを40クラスターに分類したうえで,各クラスター内の災害発生セル割合に基づき設定した.さらにk-means法によるクラスター分類の際に素因と誘因の重みづけを対等にするために,入力データを誘因2項目(前60分積算降水量,土壌雨量指数)と素因2項目(斜面勾配,断層の有無)とした.その結果,学習過程(2011年9月21日15時のデータを使用)ではepoch数が進むにつれて誤差が減少し,ニューラルネットワーク出力分布では実際に土石流が発生した地点において高い値が出力され,意図したとおりに学習が進むようになった.また,検証過程(2011年9月3日11時のデータを使用)においてもepoch数が進むにつれて一旦誤差が上昇するがその後徐々に減少し,若干過学習傾向にあるが検証用データに対してもネットワーク適用可能と考えられた.また,検証用データを入力したニューラルネットワーク出力分布では,実際に土石流が発生した地点で高い値を示した.
このことから,本研究で構築した手法を改良していくことで,その出力分布を土砂災害危険度として活用できる可能性が示唆された.また,手法構築に当たっては入力データの十分な選別,適切な問題設定,誘因と素因の重みづけを揃えることが重要であることが示唆された.本研究では特定の土砂災害発生事例を用いて学習と検証を行ったが,今後は学習過程により多くの事例を用いるよう改良を行う必要がある.