12:20 〜 12:40
[4I2-GS-11-02] 字種変換を用いた再攻撃による敵対的事例矯正に関する試み
[[オンライン]]
キーワード:深層ニューラルネットワーク、自然言語処理、敵対的事例、敵対的防御
深層ニューラルネットワーク(DNN)は,画像処理や音声認識,自然言語処理など,多岐にわたる分野で著しい進展を遂げており,その性能の高さから幅広い応用が進んでいる.一方,近年の研究により,DNNには微小な変更が加えられた入力データである敵対的事例(AE)を誤認識してしまう脆弱性が存在することが明らかにされている.日本語処理用のDNNも同様の脆弱性が存在し,このような脆弱性は,DNNを実世界の課題に応用する上で重大な障害となり得る.現在,日本語処理用のDNNを対象とした敵対的防御の研究は十分に行われておらず,日本語の特性を活かした防御手法も,著者らが調べた限りこれまでに研究されていない.本研究では,AEに対する日本語処理用モデルの頑健性向上を目的とし,日本語に特化した再攻撃による敵対的防御手法を提案する.提案手法は,日本語特有の表記体系である字種を変換する微小な摂動による再攻撃を行うことで,正常事例と区別せずに,AEの分類結果のみを矯正する.評価実験の結果,提案手法が正常事例の分類結果を維持しつつ,AEの分類結果を矯正できることを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。