[3Rin4-69] 標的型敵対的攻撃による巻き込み現象の検出と可視化
キーワード:敵対的サンプル、遺伝的アルゴリズム、挙動の理解
機械学習における敵対的攻撃が注目を集めている。ブラックボックスなニューラルネットに対する普遍的かつ標的型の敵対的攻撃は困難と言われており、これを利用したニューラルネットの構造解析の知見は未だ十分とは言えない。本稿では,ブラックボックス・普遍的・標的型攻撃のための画像ノイズを遺伝的アルゴリズムによって作成し、これを適用した他クラスサンプルの圧縮空間上での遷移挙動から,ニューラルネットワークの特徴量構造の特性を調査した.その結果、あるクラスに対する標的型ノイズが、他クラスのサンプルに特徴的な遷移を誘導する「巻き込み」現象が観察された。巻き込みの発生度合いはクラスごとに異なったため、クラスごとに敵対的攻撃に対する耐性が異なることが示唆された。これらはクラスの距離に対応する何らかの指標と解釈することができ,ひいては特徴量空間の解析の糸口になると考えられる.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。