2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-2 機械学習

[2A1-GS-2] 機械学習:進化計算・マルチエージェント・XAI他

2023年6月7日(水) 09:00 〜 10:20 A会場 (メインホール)

座長:髙野 諒(立命館大学) [オンライン]

09:40 〜 10:00

[2A1-GS-2-03] Self-Examination Mechanism: 説明可能AIを用いた敵対的攻撃に対する軽量な防御機構

〇末神 奏宙1、小栗 悠太郎1、趙 在瀛1、加賀谷 湧1、向井 皇喜1、吉田 舜1、琛 付1、山崎 俊彦1 (1. 東京大学)

キーワード:敵対的サンプル、説明可能AI、画像分類

深層学習をベースにした画像分類モデルには、敵対的サンプル(adversarial examples:AE)を誤分類するという脆弱性がある。既存の防御手法はAEに対する分類精度を改善していたが、摂動が付与されていない正常な画像に対しての分類精度が悪化する。この問題を解決するために、我々はself-examination mechanismという新たな防御機構を提案する。本手法では、最初に入力画像を分類した後、SHapley Additive exPlanations(SHAP)という説明可能AIの手法を用いて分類モデルの推論過程を検証し、異常ならばSHAPの出力に基づいて再度分類を行う。よって、正常な画像の分類精度を大きく下げることなく、誤分類を防ぐことができる。実際に、CIFAR10を学習したResNet及びWideResNetに提案手法を適用した結果、AEに対する精度が改善し、正常な画像に対する精度はほとんど悪化しないことを確認した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード