14:10 〜 14:30
[2F4-GS-5-03] 大規模言語モデルを用いたレイアウト生成エージェント
キーワード:レイアウト生成、大規模言語モデル、マルチモーダル、エージェント
近年,カスタマイズ可能な3D仮想空間の需要は高まっている.仮想空間を作成するには多大な人的労力が必要とされるため,仮想空間作成の効率化が求められている.既存研究において,家の間取りや室内の家具の配置などのレイアウトを自動生成する手法が提案されているが,これらの手法は入力指示に対してレイアウト構造を示すテキストを生成するだけであり,生成過程で得られる仮想空間の情報を活用していない.本研究ではマルチモーダル大規模言語モデルのGPT-4Vを用いたエージェント操作型のレイアウト生成システムを提案し,その有効性を検証する.具体的には,言語モデルがエージェントを操作して仮想空間上に一つずつオブジェクトを設置していくことで,ユーザ指示を反映したレイアウトを生成する.実験結果から,提案手法によりユーザの指示を反映した仮想空間を高い成功率で生成できることを確認した.また,アブレーションテストを通じて行動生成の性能向上に寄与する要素を特定することに成功した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。