18:10 〜 18:30
[2D6-OS-18c-02] データ分布の対照によるシーン認識モデルの改良
キーワード:深層生成モデル、世界モデル、シーン認識
複雑な物体を多数含む実世界のような環境において、意味や機能などの抽象的な概念に基づいてそれらを分割・認識する「シーン認識」は重要な高次の認知機能の一つである。近年、環境のモデル化を行い行動を決定する「世界モデル」と呼ばれる一連の研究が注目を集めているが、本研究はシーンや物体の認識などを考慮し、世界モデルにおける表現獲得の高度化を目指したものである。
既存の生成モデルによるシーン認識は完全な教師なし学習であるため、オブジェクトとして認識すべき対象に関する制約がなく、目的通りの分割ができないという問題がある。例えば実画像のような複雑なテクスチャを含むデータは適切な分割が難しく、この問題は手法の適用範囲を狭める原因となっている。本研究では、分割すべき対象に関する知識を取り込み、複雑なオブジェクトでも適切に分割を行うことができる手法を考える。具体的には、背景と前景の確率分布の対照を行うことで最初に背景を分割し、前景に関してはさらにオブジェクト単位の分割を行うことを考える。これにより、既存手法で対応が困難であったデータに対しても認識可能となることを示す。
既存の生成モデルによるシーン認識は完全な教師なし学習であるため、オブジェクトとして認識すべき対象に関する制約がなく、目的通りの分割ができないという問題がある。例えば実画像のような複雑なテクスチャを含むデータは適切な分割が難しく、この問題は手法の適用範囲を狭める原因となっている。本研究では、分割すべき対象に関する知識を取り込み、複雑なオブジェクトでも適切に分割を行うことができる手法を考える。具体的には、背景と前景の確率分布の対照を行うことで最初に背景を分割し、前景に関してはさらにオブジェクト単位の分割を行うことを考える。これにより、既存手法で対応が困難であったデータに対しても認識可能となることを示す。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。