2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-17 ひと中心の未来社会とAI

[4P3-OS-17c] ひと中心の未来社会とAI

2024年5月31日(金) 14:00 〜 15:20 P会場 (401会議室)

オーガナイザ:名取 直毅(株式会社アイシン)、梶 大介(株式会社デンソー)、廣瀬 正明(株式会社デンソー)、河村 芳海(トヨタ自動車株式会社)、梶 洋隆(トヨタ自動車株式会社)、城殿 清澄(株式会社豊田中央研究所)

14:00 〜 14:20

[4P3-OS-17c-01] 自然言語指示に基づく環境地図の作成

〇出口 秀輝1、田口 峻1 (1. 株式会社豊田中央研究所)

キーワード:画像言語ナビゲーション、地図作成、大規模言語モデル

近年,vision-and-language navigation(VLN)の研究が大きく進展している.VLNは人とロボットの共生空間における有用な指示方法を提示する一方,その問題設定ではナビゲーション毎にユーザーの指示が必要となる.そこで我々は,ユーザーの言語による経路指示を用いて地図を作成し,それをVLNに利用する手法を検討した.この地図を用いることで,新たな目的地に対して詳細な経路指示を与えずとも,地図から経路指示を生成することが可能となる.本研究では,大規模な言語モデルを用いた2つのアプローチを紹介する.1つは大規模言語モデルに直接経路指示を入力し,経路を記憶させる方法,もう1つはモデル外にグラフ構造の地図を構築し,大規模言語モデルから利用可能にする方法である.グラフ構造の地図を用いた実験では,提案手法の空間構造の把握能力を評価するため,複数の経路を組み替えて未説明の経路を生成する実験を行った.結果から、既存の大規模言語モデルの限界を示す一方,モデルが利用可能なグラフ構造の地図を外部に持つことで,これらの能力を獲得できることを示す.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード