16th Forum on Data Engineering and Information Management

Presentation information

Oral Presentations

Track 4: Media Processing, HCI (Human-Computer Interaction), and Human-Centered Information Management

生成系マルチメディア

Wed. Feb 28, 2024 4:00 PM - 6:10 PM T-4A (オンライン(Zoom Events))

座長:井手 一郎(名古屋大学) 
コメンテータ:野宮 浩揮(京都工芸繊維大学)

5:20 PM - 5:45 PM

[T4-A-3-04] 条件付きトランスフォーマーとテキストリフレーサーに基づくクワッドローター用視覚言語ナビゲーション

*Chen Zhe2,1、Li Jiyi1、Fukumoto Fumiyo1、Liu Peng2、Suzuki Yoshimi1 (1. 山梨大学、2. 杭州電子科技大学)

発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:なし

Keywords:視覚言語ナビゲーション、クワッドローター、マルチモーダル、大規模言語モデル