16:00 〜 16:20
[4G4-GS-2m-02] Transformerを用いた深層生成モデルによる教師なし物体認識手法の提案
キーワード:深層生成モデル、世界モデル、シーン認識、物体認識
近年,深層学習による物体認識が高い精度を発揮するようになっている.現在の主な手法は,基本的に正解データを用いる教師あり学習によるものであるが,近年は深層生成モデルを用いた教師なし物体認識(シーン解釈)の研究が行われるようになっている.これは単に教師データが不要となるだけではなく,生成モデルによって各物体の表現を獲得可能であるという利点があり,物体を認識して行動・意思決定を行う高度なエージェントの構築には重要な手法である.
しかし,現状では簡単なデータセットに適用範囲が限定されており,例えば実画像など一部のデータセットは上手く扱えないことが知られている.本研究ではTransformerを用いた新たなシーン解釈手法と,この手法に必要な自己教師あり学習の方法を提案し,既存手法では扱えなかったデータセットに対しても提案手法が有効であることを示す.
しかし,現状では簡単なデータセットに適用範囲が限定されており,例えば実画像など一部のデータセットは上手く扱えないことが知られている.本研究ではTransformerを用いた新たなシーン解釈手法と,この手法に必要な自己教師あり学習の方法を提案し,既存手法では扱えなかったデータセットに対しても提案手法が有効であることを示す.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。