[1Win4-49] 物体操作指示文生成モデルに基づくモバイルマニピュレーションのためのデータセット拡張
キーワード:画像キャプショニング、物体操作指示文生成、生活支援ロボット
高齢化が進む社会において,自然言語指示文に基づき日常タスクを実行する生活支援ロボットの実用化は介助者不足の解決策の一つとなりうる.一方,自然言語指示文に基づき日常タスクを実行するためのマルチモーダル言語理解モデルは未だ性能が不十分であり,性能向上には高品質な自然言語指示文を含むデータセットを用いた訓練が必要である.よって生活支援ロボットの指示文理解性能向上において自然言語指示文生成は重要である.本研究では2枚の画像に基づき物体操作指示文を生成する手法を提案する.また,生成文により拡張したデータセットを用い,物体操作指示文理解モデルを訓練・評価した.結果として,理解性能が向上したことから,拡張データの有効性を確認した.また,実機実験においても同様に,拡張データが有効であることが検証された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。