09:40 〜 10:00
[2N1-GS-10-03] 過学習・ラベル誤りに堅牢なログ分析のためのpAUC最大化手法
キーワード:AUC、マルウェア検知、ログ分析
マルウェア被害を最小化するため、機械学習で通信ログを分析し、怪しいログを早期に検知する方法が実用化されている。実運用では誤検知を抑制しつつ、できるだけ多くの怪しい通信を検知しなければならないため、低誤検知率条件下での検知率が重視される。そこで、本稿では任意の誤検知率区間の検知率を直接最大化する、pAUC最大化法を扱う。誤検知が生じるとネットワーク管理者の負担となるため、実運用でpAUC最大化を実施する場合、誤検知率区間を0%から0.01%など非常に小さくかつ狭い範囲に設定する必要がある。これは、一部の限られたスコア上位の良性ログしか学習の対象としないことを意味する。しかし、実際の通信ログにはラベル誤りがスコア上位の良性ログに存在したり、スパースなデータで学習すべきパラメータが多くなる傾向があったりすることから、実運用の環境では性能低下が起こりうる。本問題を緩和すべく、本稿ではAUC最大化とpAUC最大化を組み合わせた手法を提案する。これを大企業網の通信ログに対して実装し、既存のpAUC最大化法や代表的な教師あり学習の性能と比較することで、提案法の効果を示す。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。