2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[2C1-GS-7] 画像音声メディア処理:

2024年5月29日(水) 09:00 〜 10:40 C会場 (イベントホール仮設1)

座長:西澤直樹((株)東芝)

09:20 〜 09:40

[2C1-GS-7-02] テキストプロンプトによるデザイン変更が可能な試着画像生成

〇武本 孝輔1、越仲 孝文1 (1. 横浜市立大学)

キーワード:拡散モデル、仮想試着、ファッションデザイン、生成モデル、Stable Diffusion

EC市場の拡大に伴い実店舗を介さない衣服の流通も増加しているが、衣服等は他のカテゴリに比べて返品率が高くなっている。その対策として仮想的な試着画像を生成する研究が継続して行われている。一方で衣服のデザインの補助を目的として、対象の衣服の画像ではなく、自然言語によって衣服を指定する研究も少数存在する。本研究では衣服のデザインの補助や探索のアプローチの一つとして、既存の衣服の改変や派生の探索を補助することを目的とする。Stable Diffusionをベースとしtext-to-imageとして試着画像生成モデルを構築することで言語能力を保つ。既存のcross attentionを衣服に流用するのではなく、新しく衣服情報を受け入れるTransformerのデコーダブロックを挿入することにより、試着画像生成モデルとしての競争性を持ちながら自然言語による改変が可能になることを示す。本研究のモデルは公開されているデータセットを用いて生成する試着画像の定量評価を行う。また既存の商品を元にしたデザインの補助、背景の指示が可能な試着画像の生成の例を挙げる。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード