2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[2C1-GS-7] 画像音声メディア処理:

2024年5月29日(水) 09:00 〜 10:40 C会場 (イベントホール仮設1)

座長:西澤直樹((株)東芝)

10:20 〜 10:40

[2C1-GS-7-05] LLMエージェントによるText-to-Design手法の検討

〇關 百咲1、菊池 康太郎2、井上 直人2、大谷 まゆ2、山口 光太2、シモセラ エドガー1 (1. 早稲田大学、2. サイバーエージェント)

キーワード:LLMエージェント、Text-to-Design、ユーザインターフェース、グラフィックデザイン

ユーザーインターフェースの設計などのデザインタスクは、デザイナーでない人にとって複雑で時間がかかる。デザインを生成する方法には、ピクセル画像を作成したり、自然言語のクエリから特定の形式でデザインを出力するようにモデルをトレーニングしたりする方法などがある。しかしよりソフトウェア依存が少なく、生成結果が編集可能な、一般的なデザイン生成アプローチが必要とされている。提案手法であるDesignPlannerは、大規模言語モデルを用いてデザインタスクを実行できるシステムである。基幹手法は既存のものを利用しており、PlannerとExecutorの2つのコンポーネントで構成されている。Plannerはクエリをサブクエリに分解し、Executorは予め登録された関数を用いてサブクエリを実行する。この基本的な枠組みの性能評価では、既存のコンポーネントの利用や編集など、WebサイトのUIデザインに関連する単純な操作に焦点を当てて実験を行った。その結果、この方法は非常に単純なタスクには有効であるが、やや複雑なタスクでは関数を誤って呼び出すために失敗することが示された。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード