JSAI2025

Presentation information

General Session

General Session » GS-7 Vision, speech media processing

[3N1-GS-7] Vision, speech media processing:

Thu. May 29, 2025 9:00 AM - 10:40 AM Room N (Room 1009)

座長:田崎 豪(名城大学)[[オンライン]]

10:20 AM - 10:40 AM

[3N1-GS-7-05] A Controllable Gaussian Mask-Based RISE Extension for Explaining Image Black-Box Models

〇Ryoichi Katsuya1, Toshihiko Yamasaki2 (1. Septeni Japan, Inc., 2. The University of Tokyo)

Keywords:AI Explainability, image recognition

画像の分類・予測モデルが高度化する中で、その予測の根拠を説明する重要性は増している。しかし、ホワイトボックス型の説明手法はモデルの内部構造に強く依存し、汎用的な適用が困難である。本論文では、ブラックボックス型の説明手法であるRISE (Randomized Input Sampling for Explanation) を拡張し、柔軟性を高めた新たな手法を提案する。 具体的には、RISEで用いられていたマスクを2次元ガウス分布に置き換えるとともに、その共分散を制御することで、より自由度の高い顕著性マップを提供する手法を可能にする。本実験では、共分散の制御として、事前に推定された画像の深度やセグメント情報を用いることで、より解釈性の高い顕著性マップが生成されることを確認した。 また2種類のデータセットを用いた評価では、削除指標および挿入指標が他手法と遜色ないことを示し、提案手法の有効性を実証した。

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password