[ACG39-P08] 畳み込みニューラルネットワークによる航空写真中の植生識別とその応用
キーワード:畳み込みニューラルネット、リモートセンシング、植生マッピング、グーグルアース
画像に基づく生物種の自動同定技術は、種同定や分布把握に要する労力を削減することで、高い時空間解像度での分布や個体数のマッピングを実現させうる有望な技術になる期待されている。特に近年、画像の特徴抽出と分類を深層学習の枠組みの中で自動的に最適化する畳み込みニューラルネットワーク(CNN)の技術が画像分類などで大きな成果をあげており、生態学への応用も進みつつある。しかし、CNNは衛星画像中の植生識別にはまだあまり応用されていない。その原因として①衛星画像中の植物群落の形状の不安定性 ②学習に必要となる大量の教師画像を取得の困難 の2点があげられる。筆者らはこの困難を克服するため、教師画像を細切れに分割し、小画像の単位で識別を行う方法(Ise et al., 2018)を考案した。
本研究ではこの手法を衛星画像に適用し、植物群落の識別を試みた事例を紹介する。最初に、竹林の特定を念頭においた2クラス分類モデルをCNNにより開発した。山口県山陽小野田市、京都府井手町、千葉県いすみ市周辺を対象地域とし、google earth から取得した1/500、1/1000、1/2500の3種類の縮尺の画像を56ピクセルの大きさに分割し、竹林とそれ以外のオブジェクトを識別した。識別後、混合行列を用いて正答率を判定した。縮尺は1/500、1/1000 の大きさでは9 割以上の正答率であったが、1/2500 では正答率が6割程度まで低下した。また、教師画像は同じ自治体内の竹林画像で作成した際は9 割以上の正答率であったが、他の自治体の竹林画像を教師画像とした際は識別率が7割程度まで低下した。これらのことからCNNはgoogle earth画像から竹林を高い精度で識別することが可能だが、その精度は画像の縮尺と教師画像の内容に大きく依存することが示唆された。
次に開発した識別モデルを複数の植生の識別を念頭においた多クラス分類モデル(竹林、広葉樹林、スギ・ヒノキ人工林を識別するモデル)に拡張した。
京都府井手町周辺の約50平方キロの範囲のgoogle earthの画像を元に、14層で構成されるCNNを用いて森林植生のタイプを識別するモデルを構築した。精度検証の結果、クラス分類モデルは、人工林は95%、広葉樹林は86%の精度で識別できたが、2クラス分類モデルでは約93%の精度で分類できていた竹林については83%まで精度が低下した。また、広葉樹と竹林の間で識別の間違えが頻繁に発生することも明らかになった。以上の結果は、CNNはおおむね正確に植生を識別できるが、その精度は分類クラス数が増加することによって悪化する可能性があることを示唆している。
本研究ではこの手法を衛星画像に適用し、植物群落の識別を試みた事例を紹介する。最初に、竹林の特定を念頭においた2クラス分類モデルをCNNにより開発した。山口県山陽小野田市、京都府井手町、千葉県いすみ市周辺を対象地域とし、google earth から取得した1/500、1/1000、1/2500の3種類の縮尺の画像を56ピクセルの大きさに分割し、竹林とそれ以外のオブジェクトを識別した。識別後、混合行列を用いて正答率を判定した。縮尺は1/500、1/1000 の大きさでは9 割以上の正答率であったが、1/2500 では正答率が6割程度まで低下した。また、教師画像は同じ自治体内の竹林画像で作成した際は9 割以上の正答率であったが、他の自治体の竹林画像を教師画像とした際は識別率が7割程度まで低下した。これらのことからCNNはgoogle earth画像から竹林を高い精度で識別することが可能だが、その精度は画像の縮尺と教師画像の内容に大きく依存することが示唆された。
次に開発した識別モデルを複数の植生の識別を念頭においた多クラス分類モデル(竹林、広葉樹林、スギ・ヒノキ人工林を識別するモデル)に拡張した。
京都府井手町周辺の約50平方キロの範囲のgoogle earthの画像を元に、14層で構成されるCNNを用いて森林植生のタイプを識別するモデルを構築した。精度検証の結果、クラス分類モデルは、人工林は95%、広葉樹林は86%の精度で識別できたが、2クラス分類モデルでは約93%の精度で分類できていた竹林については83%まで精度が低下した。また、広葉樹と竹林の間で識別の間違えが頻繁に発生することも明らかになった。以上の結果は、CNNはおおむね正確に植生を識別できるが、その精度は分類クラス数が増加することによって悪化する可能性があることを示唆している。