2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[2O4-GS-7] 画像音声メディア処理:一般

2022年6月15日(水) 13:20 〜 15:00 O会場 (Room 510)

座長:岡部 浩司(NEC)[遠隔]

13:20 〜 13:40

[2O4-GS-7-01] 生活支援ロボットによる物体操作タスクにおけるFunnel UNITERに基づく指示文理解

〇吉田 悠1、石川 慎太郎1、杉浦 孔明1 (1. 慶應義塾大学)

キーワード:自然言語処理、画像処理、物体操作、参照表現、ロボット

現代社会では,高齢化の進行に伴い,在宅介護者の不足が問題となっている.これを解決するため,被介護者を物理的に支援可能な生活支援ロボットが注目されている.しかし,自然言語による人間からの指示は,しばしば内容に曖昧性が生じるため,ロボットがこれを理解する能力については,現状不十分である.本研究では,既存手法の計算コストを削減しつつ,精度を改善させるため,Funnel Transformerに基づいて段階的に次元数の削減を行うFunnel UNITERモデルを提案する.また,物体操作を伴うナビゲーションタスクにおける標準データセットであるALFREDを用いて,物体操作指示理解における新たなデータセットであるALFRED-fetchを作成した.対象物体候補が命令文が対象とする物体か否かに関する分類精度,及び学習時間において,提案手法はベースライン手法を上回る性能を達成したことを報告する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード