2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-32 Mechanistic Interpretability

[3L6-OS-32] Mechanistic Interpretability

2025年5月29日(木) 17:40 〜 19:20 L会場 (会議室1007)

オーガナイザ:高槻 瞭大(AIアライメントネットワーク/東京大学),峰岸 剛基(東京大学),宮西 洋輔(サイバーエージェント/北陸先端科学技術大学院大学),高木 優(国立情報学研究所)

18:40 〜 19:00

[3L6-OS-32-04] カニッツァ錯視のリバースエンジニアリングに向けた視覚トランスフォーマのメカニズム解析

〇高槻 瞭大1,2,3、ジョセフ ソニア4,5、藤澤 逸平2,3、金井 良太2,3 (1. 東京大学、2. 株式会社アラヤ、3. 一般社団法人AIアライメントネットワーク、4. Mila - Quebec AI研究所、5. マギル大学)

キーワード:機械論的解釈可能性、錯視、視覚トランスフォーマー

主観的輪郭の形成は予測符号化によって説明されてきたが、その詳細メカニズムは未だ解明されていない。本研究では、順伝播型ネットワークである視覚トランスフォーマにおいてもカニッツァ錯視が生じることを明らかにし、従来の説明に一石を投じる。そして、その形成メカニズムの解明を目的として、機械論的解釈可能性の新たな手法を提案し、モデル内部でどのように予測が更新されていくか調査を行う。最後に、モデルと生物の間で明らかになってきているメカニズムの普遍性を議論し、本研究の知見が生体における主観的輪郭の理解に貢献する可能性について考察する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード