14:15 〜 14:30
[MGI37-03] フェーズドアレイ気象レーダーの観測ビッグデータを用いた深層学習による降雨エコーの分類
キーワード:フェーズドアレイ気象レーダー、観測ビッグデータ、深層学習、降雨エコー分類
フェーズドアレイ気象レーダー(PAWR)は、ゲリラ豪雨や竜巻・突風等による突発的気象災害の早期検知や予測を行うことを目標として開発された。吹田、神戸、沖縄に設置されたPAWRでは、30秒毎の3次元観測を定常的に行っており、これまでに2PBを超える観測ビッグデータが蓄積されている。リアルタイム観測データはスマホアプリの「3D雨雲ウォッチ」や「理研3Dナウキャスト」で利用されており、顕著事例のデータ解析やデータ同化に関する研究成果も出ているが、ゲリラ豪雨予測が実現できたとは言えない。また、多くのアーカイブされた過去データも有効に利用されているとは言えない。近年急速に発展している深層学習により、人間が脳を使って行う判断を計算機が実現できる時代となった。深層学習は大量のデータを用いて学習する必要があるが、人間が処理するデータ解析では得られないような成果も期待される。そこで本研究では、畳み込みニューラルネットワーク(CNN)という深層学習技術を用いることで、ゲリラ豪雨予測につながるような前兆現象の自動抽出を試みることを目標とする。今回は最初の試みとして、PAWRで観測された降雨分布の2次元画像データから降雨エコーの分類を試みる。降雨エコー分類というと対流性あるいは層状性という降雨タイプの違いも重要であるが、それに加えて、降雨エコーの形態として孤立状、線状、団塊状という降雨分布の分類を試みる。
PAWRのオリジナル観測データは極座標のバイナリデータとして保管しているが、今回の深層学習にはWeb Pageでリアルタイム公開している高度2 kmのエコー強度の水平分布を示すクイックルック(QL)画像を用いる。今回用いる神戸PAWRの蓄積されたQL画像の数を調べたところ、2014年が24万枚(稼働率90%)、2015年が102万枚(97%)、2016年が101万枚(96%)、2017年が78万枚(75%)、2018年が85万枚(292日分まで)で、合計390万枚のQL画像が存在することが分かったが、半数以上は直径120kmのレーダー観測範囲に降雨が存在しないQL画像であり、降雨エコー分類には利用できない。深層学習を行うためにはQL画像にラベルを付ける必要があり、たとえ1万枚の画像でも人間が手動でラベル付けするのは容易ではない。幸いなことに、Web公開している降雨サマリーグラフ作成のために、それぞれのQL画像に対応する平均降雨量・最大降雨量・降雨面積の数値情報をテキストファイルで保存しているので、それを用いて大まかなラベル付けを行った後で最終的には人間の目で判断する(特に線状と塊状の違い)。最終的には強い/弱い孤立対流性、線状対流性、塊状対流性、および層状性、降雨無しの8種類に分類を行い、2016年6、7,8月の50日間のデータからそれぞれ900サンプル以上を確保した上で、シンプルな7層のCNNを使って1000回程度反復学習させた結果、72%の精度で降雨エコー分類を行うことができた。曖昧なラベリングのサンプルを除いたり、より複雑なCNNネットワークを用いたりすることで精度を上げることは可能と考えている。将来的には、3次元データと時系列データを用いることで豪雨予測につながるような研究を進めたい。
PAWRのオリジナル観測データは極座標のバイナリデータとして保管しているが、今回の深層学習にはWeb Pageでリアルタイム公開している高度2 kmのエコー強度の水平分布を示すクイックルック(QL)画像を用いる。今回用いる神戸PAWRの蓄積されたQL画像の数を調べたところ、2014年が24万枚(稼働率90%)、2015年が102万枚(97%)、2016年が101万枚(96%)、2017年が78万枚(75%)、2018年が85万枚(292日分まで)で、合計390万枚のQL画像が存在することが分かったが、半数以上は直径120kmのレーダー観測範囲に降雨が存在しないQL画像であり、降雨エコー分類には利用できない。深層学習を行うためにはQL画像にラベルを付ける必要があり、たとえ1万枚の画像でも人間が手動でラベル付けするのは容易ではない。幸いなことに、Web公開している降雨サマリーグラフ作成のために、それぞれのQL画像に対応する平均降雨量・最大降雨量・降雨面積の数値情報をテキストファイルで保存しているので、それを用いて大まかなラベル付けを行った後で最終的には人間の目で判断する(特に線状と塊状の違い)。最終的には強い/弱い孤立対流性、線状対流性、塊状対流性、および層状性、降雨無しの8種類に分類を行い、2016年6、7,8月の50日間のデータからそれぞれ900サンプル以上を確保した上で、シンプルな7層のCNNを使って1000回程度反復学習させた結果、72%の精度で降雨エコー分類を行うことができた。曖昧なラベリングのサンプルを除いたり、より複雑なCNNネットワークを用いたりすることで精度を上げることは可能と考えている。将来的には、3次元データと時系列データを用いることで豪雨予測につながるような研究を進めたい。