14:00 〜 14:20
[4P3-J-10-01] 高環境耐性なCNN回帰モデルのメモリ削減検討
キーワード:画像認識、深層学習、低ランク近似
近年、多分野で画像認識ソリューションの需要が拡大している。
特に交通インフラの分野においては、交通量計測や車両捜査等の監視機能高度化・自動化を行うことが期待されている。
しかし、これらの用途は野外での運用となるため、高い環境耐性(気象条件や照明変化等)が要求される。
また、限られた計算リソースのエッジ上でリアルタイム処理を行う場合、軽量高速な認識が必要となる。
我々はNP文字認識を対象とし、畳み込みニューラルネットワーク(以下、CNN)回帰モデルのメモリ削減について検討する。
文字認識を行う際、事前に歪みやずれを補正して正面に向ける幾何学変換を行う事で、その後の文字認識精度が向上することが報告されており、NPに対しても有効であることを確認している。
補正を高精度に行うにはCNNの適用が考えられるが、CNNはパラメータ数が増えるため、実行メモリが大きくなることが課題となる。
本稿では、歪み補正の幾何学変換パラメータの推定を行うCNN に対し、多環境下での推定精度の劣化を最小限に実行メモリを大幅に軽量化することを目的とし、
低ランク近似およびfine-tuning を用いた軽量化の検討結果について報告する。
特に交通インフラの分野においては、交通量計測や車両捜査等の監視機能高度化・自動化を行うことが期待されている。
しかし、これらの用途は野外での運用となるため、高い環境耐性(気象条件や照明変化等)が要求される。
また、限られた計算リソースのエッジ上でリアルタイム処理を行う場合、軽量高速な認識が必要となる。
我々はNP文字認識を対象とし、畳み込みニューラルネットワーク(以下、CNN)回帰モデルのメモリ削減について検討する。
文字認識を行う際、事前に歪みやずれを補正して正面に向ける幾何学変換を行う事で、その後の文字認識精度が向上することが報告されており、NPに対しても有効であることを確認している。
補正を高精度に行うにはCNNの適用が考えられるが、CNNはパラメータ数が増えるため、実行メモリが大きくなることが課題となる。
本稿では、歪み補正の幾何学変換パラメータの推定を行うCNN に対し、多環境下での推定精度の劣化を最小限に実行メモリを大幅に軽量化することを目的とし、
低ランク近似およびfine-tuning を用いた軽量化の検討結果について報告する。