17:15 〜 19:15
[ACG41-P06] グローバル洪水イベントで学習した浸水マッピングモデルの汎化性能評価 〜洪水物理変数の導入効果と日本国内事例への適用〜
キーワード:衛星洪水マッピング、物理を活用した機械学習、洪水物理データ、合成開口レーダー
近年、衛星画像を用いた準リアルタイムの洪水マッピングは、災害対応において極めて重要な技術となっている。衛星データを迅速に解析することで、救助活動の意思決定や被害状況の早期把握に大きく貢献できるからである。しかし、従来の研究の多くは特定の洪水イベントに限定したケーススタディベースの評価にとどまっており、時空間的に離れた洪水イベントに対するモデルの汎化性能が十分に検証されていないのが現状である。実際の洪水は地球上のあらゆる場所で発生し、地理条件固有の影響を受けるため、学習データに含まれない地域や条件でも高い精度を維持できるモデルの開発は、実運用を想定するうえで不可欠である。
そこで本研究では、世界各地の多様な洪水イベントを学習データとし、そこに含まれていない洪水イベントに対してどの程度の推定精度を示すのか、すなわちモデルの汎化性能を評価することを目的とする。加えて、多くの衛星浸水マッピング研究がデータドリブンな手法を主とする一方で、洪水の物理的プロセスの知見を積極的にモデルへ取り込んだ研究はまだ多くはない。そこで本研究では、機械学習ベースのアプローチを採用しつつも、洪水物理に基づく追加変数を導入することで、衛星浸水マッピングの推定精度を向上させる方法を提案する。
本研究では、SARによる浸水域マッピングの検証に向けて、Sentinel-1 SAR、MERIT DEM(標高データ)、河道からの相対標高(FLDDIF)を入力データに利用した。学習データとしてグローバルの洪水データベースであるSen1Floods11を利用する。汎化性能を評価するためには、訓練データとして用いたSen1Floods11に含まれていない洪水イベントを対象にモデルの検証を行う必要がある。そこで、2019年の台風19号(Hagibis)により日本国内で発生した洪水災害について、国土地理院が調査・公開している「浸水推定段彩図」を利用する。モデルと検証データの水平解像度は1arcsec(約30m)に統一した。
モデルは衛星データを用いた洪水域抽出のためU-Netを採用する。SAR(VV/VH偏波)や標高・水理情報を3チャネル入力とし、Convolutional Neural Network (CNN) 、Batch normalization (BN)、 ReLU、 Dropoutの層を組み合わせたCBRモジュールによる特徴量抽出を行った後、最終的に1チャネルの浸水確率マップを出力する。
検証の結果、浸水被害が確認された複数の河川に対してモデルの出力は93.1%の正解率を達成し、可視化画像からも空間的に整合の取れた推論を得られた。これは、グローバルな洪水イベントで学習したモデルであっても、日本国内の洪水事例に対して一定の汎化性能を示す可能性を示唆している。一方で、正解率(accuracy)は高いものの再現率(recall)が相対的に低く(32.4%)、浸水ピクセルの見逃し(false negative)が多い傾向が確認された。局所的な洪水イベントを対象とする学習データでは、非浸水(陰性)ピクセルが大部分を占めがちであり、モデルが全体的に「過小評価」傾向となることが一因と考えられる。
しかし、DEMやFLDDIFを追加入力するとSAR単体と比較して再現率(recall)が48.1%、46.3%と大きく改善し、結果、バランス指標であるF1スコアも向上した。
エラー分析より、これらの物理変数の追加入力により、false negativeの領域が減少し、見逃しが低減されたことが可視化でも確認できた。洪水のような災害検出においては見逃しを防ぐことは重要性が高い。さらに、光学衛星による撮影画像と比較し、見逃し低減がどのような地域で生じているかを分析したところ、水田などの土地利用が複雑なエリアにおいて効果が大きいことが示唆された。これらの地域は植生や水面反射などによるSAR信号のノイズが顕著な地域で、水文データを付加したことで誤検知が補正され、識別精度が向上したと考えられる。
これらの成果は、衛星データを活用した準リアルタイム洪水マッピングにおいて、地形や水理特性などの物理プロセスに基づく情報を適切に組み込むことの意義を示している。
今後のさらなる発展可能性としては、まず本研究で使用したSentinel-1(C-band)を中心としたモデルに対し、他バンド(L-band, X-band)のデータ入力に対しても一定以上の精度を維持するモデルを構築することが挙げられる。実際に、洪水は世界各地の多様な地理・気象条件で発生するため、C-bandだけでグローバルのイベントに対応することは難しく、複数バンドの情報を組み合わせることで、より頑健かつ包括的な洪水検出が可能になると考えられる。
そこで本研究では、世界各地の多様な洪水イベントを学習データとし、そこに含まれていない洪水イベントに対してどの程度の推定精度を示すのか、すなわちモデルの汎化性能を評価することを目的とする。加えて、多くの衛星浸水マッピング研究がデータドリブンな手法を主とする一方で、洪水の物理的プロセスの知見を積極的にモデルへ取り込んだ研究はまだ多くはない。そこで本研究では、機械学習ベースのアプローチを採用しつつも、洪水物理に基づく追加変数を導入することで、衛星浸水マッピングの推定精度を向上させる方法を提案する。
本研究では、SARによる浸水域マッピングの検証に向けて、Sentinel-1 SAR、MERIT DEM(標高データ)、河道からの相対標高(FLDDIF)を入力データに利用した。学習データとしてグローバルの洪水データベースであるSen1Floods11を利用する。汎化性能を評価するためには、訓練データとして用いたSen1Floods11に含まれていない洪水イベントを対象にモデルの検証を行う必要がある。そこで、2019年の台風19号(Hagibis)により日本国内で発生した洪水災害について、国土地理院が調査・公開している「浸水推定段彩図」を利用する。モデルと検証データの水平解像度は1arcsec(約30m)に統一した。
モデルは衛星データを用いた洪水域抽出のためU-Netを採用する。SAR(VV/VH偏波)や標高・水理情報を3チャネル入力とし、Convolutional Neural Network (CNN) 、Batch normalization (BN)、 ReLU、 Dropoutの層を組み合わせたCBRモジュールによる特徴量抽出を行った後、最終的に1チャネルの浸水確率マップを出力する。
検証の結果、浸水被害が確認された複数の河川に対してモデルの出力は93.1%の正解率を達成し、可視化画像からも空間的に整合の取れた推論を得られた。これは、グローバルな洪水イベントで学習したモデルであっても、日本国内の洪水事例に対して一定の汎化性能を示す可能性を示唆している。一方で、正解率(accuracy)は高いものの再現率(recall)が相対的に低く(32.4%)、浸水ピクセルの見逃し(false negative)が多い傾向が確認された。局所的な洪水イベントを対象とする学習データでは、非浸水(陰性)ピクセルが大部分を占めがちであり、モデルが全体的に「過小評価」傾向となることが一因と考えられる。
しかし、DEMやFLDDIFを追加入力するとSAR単体と比較して再現率(recall)が48.1%、46.3%と大きく改善し、結果、バランス指標であるF1スコアも向上した。
エラー分析より、これらの物理変数の追加入力により、false negativeの領域が減少し、見逃しが低減されたことが可視化でも確認できた。洪水のような災害検出においては見逃しを防ぐことは重要性が高い。さらに、光学衛星による撮影画像と比較し、見逃し低減がどのような地域で生じているかを分析したところ、水田などの土地利用が複雑なエリアにおいて効果が大きいことが示唆された。これらの地域は植生や水面反射などによるSAR信号のノイズが顕著な地域で、水文データを付加したことで誤検知が補正され、識別精度が向上したと考えられる。
これらの成果は、衛星データを活用した準リアルタイム洪水マッピングにおいて、地形や水理特性などの物理プロセスに基づく情報を適切に組み込むことの意義を示している。
今後のさらなる発展可能性としては、まず本研究で使用したSentinel-1(C-band)を中心としたモデルに対し、他バンド(L-band, X-band)のデータ入力に対しても一定以上の精度を維持するモデルを構築することが挙げられる。実際に、洪水は世界各地の多様な地理・気象条件で発生するため、C-bandだけでグローバルのイベントに対応することは難しく、複数バンドの情報を組み合わせることで、より頑健かつ包括的な洪水検出が可能になると考えられる。