6:40 PM - 7:00 PM
[3Q6-GS-8-04] LMD-PGN
一人称視点画像から三人称視点BEV地図へのクロスモーダル知識蒸留による汎用的な点目標ナビゲーション
[[Online]]
Keywords:Cross-Lingual Cross-Modal Knowledge Distillation, local map descriptor, point target navigation
ポイントゴールナビゲーション (PGN) は、地図を事前に作成せずロボットが視覚的に目標地点へ移動する技術ですが、現在のPGN手法は単一ロボットシステム向けに設計され、多様なプラットフォームを持つマルチロボットシナリオへの汎用性が制限されています。本研究では、教師ロボットの学習済みモデルを生徒ロボットに転送可能な知識転移フレームワークを提案します。このフレームワークは未知のプラットフォームやブラックボックス環境にも対応可能です。第一人称視点 (FPV) を第三人称視点 (TPV) に転送し、状態をSLAMで再構築された局所地図、動作をサブゴールにマッピングします。さらに、ノイズに強い局所地図記述子 (LMD) を用いてトレーニング効率を向上させる手法を導入しました。2Dロボットで検証され、Habitat-Sim環境での実験によりスケーラブルかつ汎用性の高いPGNソリューションが確認されました。
Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.