14:20 〜 14:40
[2P3-J-2-04] 転移学習による機械語命令列分類における学習の効率化
キーワード:転移学習、CNN、機械語命令列分類
我々は過去に,ファイルの断片から実行コードを99%以上の精度で認識できる手法(o-glasses)を提案した.この手法は,入力データを実行コードとみなし,これを固定長命令に変換したものを1d-CNNに入力している.この分類問題は,容易に大規模なデータセットを準備できた.しかしながら,容易に大規模なデータセットを準備できない問題も数多く存在する.
そこで我々は,転移学習を活用することにより効率的に学習する手法を提案する.本論文では,データセットの大規模化が困難な分類問題として,パッカー推定を例に実験を行った.その結果,各クラスで10サンプルしか準備できない場合においても,30クラス分類で92.0%のAccuracyで分類できた.これは,転移学習を用いない場合と比較して1.7%の精度向上であった.
提案手法は,既存手法と同程度のデータセットを準備できる場合は同程度の性能が得られる.加えて,十分にデータセットを準備できない場合は既存手法より良い性能が得られる可能性がある.そのため,提案手法は既存手法より多様な領域に適用可能であると考えられる.
そこで我々は,転移学習を活用することにより効率的に学習する手法を提案する.本論文では,データセットの大規模化が困難な分類問題として,パッカー推定を例に実験を行った.その結果,各クラスで10サンプルしか準備できない場合においても,30クラス分類で92.0%のAccuracyで分類できた.これは,転移学習を用いない場合と比較して1.7%の精度向上であった.
提案手法は,既存手法と同程度のデータセットを準備できる場合は同程度の性能が得られる.加えて,十分にデータセットを準備できない場合は既存手法より良い性能が得られる可能性がある.そのため,提案手法は既存手法より多様な領域に適用可能であると考えられる.