4:00 PM - 5:30 PM
[S24P-02] An unsupervised automatic classification for continuous seismic records: introducing an anomaly detection algorithm to solve the imbalanced data problem
地震計の連続波形記録には,自然地震,人為的活動,機器ノイズといった様々な波形が記録されている.連続波形記録を自動的に分類することができれば,地震計周辺の地球物理的現象の理解や,緊急地震速報といったリアルタイム処理で用いる観測機器の品質管理につながると期待される.本研究では,様々な観測環境下に設置された地震計に適用可能となるよう,教師なし学習による連続波形記録の自動分類手法の開発を行っている.同手法では,まず特徴量としてランニングスペクトルを計算した後,周波数空間でk-means法,時間領域でスペクトラルクラスタリング法を適用し,波形の分類を行う.
連続波形記録を自動分類する上で大きな問題となるのは,一般的に対象となるデータが不均衡(例えば,He and Garcia, 2009)になることである.つまり,波形の大部分は定常シグナル(バックグラウンドノイズなど)であり,非定常シグナル(地震など)は相対的にデータ量が少ない.そのため,そのまま連続波形記録に教師なし学習を適用した場合,定常シグナルのみが過度に細かく分類されてしまう恐れがある.この問題に対処するため,サンプリングに基づく簡易的な異常検知手法(Sugiyama and Borgwardt, 2013)を導入した.周波数空間でのクラスタリングを行う前に,異常検知手法により「正常値」と「異常値」(全データのうち1.0%)のデータ点を抽出した上で,これらのデータ点に対してk-means法を適用するよう,手法を改良した.
この手法を2017年3月1日~7日に記録されたMeSO-net観測点E.JDJM(地下鉄近傍の観測点;川北・酒井,2009)の連続波形記録に対して適用した.異常検知手法を導入しなかった場合,不均衡データの影響によって地下鉄ノイズは複数のクラスに細分化されてしまっていたが,異常検知手法を導入した手法では,地下鉄ノイズは単一のクラスに分類されるようになった.これは,異常検知手法の導入が連続波形記録分類における不均衡データ問題の解決に有効な手段のひとつであることを示している.
連続波形記録を自動分類する上で大きな問題となるのは,一般的に対象となるデータが不均衡(例えば,He and Garcia, 2009)になることである.つまり,波形の大部分は定常シグナル(バックグラウンドノイズなど)であり,非定常シグナル(地震など)は相対的にデータ量が少ない.そのため,そのまま連続波形記録に教師なし学習を適用した場合,定常シグナルのみが過度に細かく分類されてしまう恐れがある.この問題に対処するため,サンプリングに基づく簡易的な異常検知手法(Sugiyama and Borgwardt, 2013)を導入した.周波数空間でのクラスタリングを行う前に,異常検知手法により「正常値」と「異常値」(全データのうち1.0%)のデータ点を抽出した上で,これらのデータ点に対してk-means法を適用するよう,手法を改良した.
この手法を2017年3月1日~7日に記録されたMeSO-net観測点E.JDJM(地下鉄近傍の観測点;川北・酒井,2009)の連続波形記録に対して適用した.異常検知手法を導入しなかった場合,不均衡データの影響によって地下鉄ノイズは複数のクラスに細分化されてしまっていたが,異常検知手法を導入した手法では,地下鉄ノイズは単一のクラスに分類されるようになった.これは,異常検知手法の導入が連続波形記録分類における不均衡データ問題の解決に有効な手段のひとつであることを示している.