18:50 〜 19:10
[2J6-GS-2-04] A3CにおけるAttention機構を用いた視覚的説明
キーワード:強化学習、視覚的説明
深層強化学習の代表的な手法であるAsynchronous Advantage Actor-Critic (A3C)は,ロボット制御やゲームタスクにおいて高精度な結果を獲得している.しかし,推論時におけるモデル内部の演算が複雑であるため,モデルの推論結果に対する判断根拠が不明確である.そのため,モデルがどのように判断し推論したか容易に説明できる仕組みが必要である.本研究では,Policy branchの特徴マップに対しAttention mapを用いてマスク処理を行うMask Attention A3Cを提案する.Atari2600を用いた実験により,スコアの比較及び獲得したAttention mapを用いた視覚的説明を行う.また,注視領域を反転させた場合においてもスコアを確認することで,獲得したAttention mapの有効性を示す.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。