第16回データ工学と情報マネジメントに関するフォーラム

講演情報

一般発表

Track 4: メディア処理・HCI・人間中心情報マネジメント

生成系マルチメディア

2024年2月28日(水) 16:00 〜 18:10 T4-A (オンライン(Zoom Events))

座長:井手 一郎(名古屋大学) 
コメンテータ:野宮 浩揮(京都工芸繊維大学)

17:20 〜 17:45

[T4-A-3-04] 条件付きトランスフォーマーとテキストリフレーサーに基づくクワッドローター用視覚言語ナビゲーション

*Chen Zhe2,1、Li Jiyi1、Fukumoto Fumiyo1、Liu Peng2、Suzuki Yoshimi1 (1. 山梨大学、2. 杭州電子科技大学)

発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:なし

キーワード:視覚言語ナビゲーション、クワッドローター、マルチモーダル、大規模言語モデル