2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[2O1-GS-7] 画像音声メディア処理:生成

2022年6月15日(水) 09:00 〜 10:40 O会場 (Room 510)

座長:栗田 修平(理化学研究所)[現地]

09:40 〜 10:00

[2O1-GS-7-03] Lambda Attention Branch Networksによる視覚的説明生成

〇飯田 紡1、兼田 寛大1、平川 翼2、山下 隆義2、藤吉 弘亘2、杉浦 孔明1 (1. 慶應義塾大学、2. 中部大学)

キーワード:視覚的説明生成、Attention Branch、Lambda Networks、transformer

深層学習が幅広い分野に応用されている現代において、モデルの説明性は重要である。
しかし、Lambdaに基づくtransformerの視覚的説明生成に関する研究はほとんどない。
本論文では、重要な領域に詳細に注目し、解釈しやすい視覚的説明を生成する、Lambda Attention Branch Networksを提案する。
また、 スパースな重要領域を有する画像に有効な評価指標として、Insertion-Deletion scoreを拡張したPatch Insertion-Deletion scoreを提案する。
2つの標準データセットにおける実験結果から、提案手法が視覚的説明の生成に成功することを示した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード