2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-10 AI応用

[1N5-GS-10] AI応用:Creative Design

2023年6月6日(火) 17:00 〜 19:00 N会場 (会議室 D2)

座長:水本 智也(LINE) [現地]

17:00 〜 17:20

[1N5-GS-10-01] 拡散モデルにおけるAttentionを制御したイラストからのファサード画像の生成と編集

〇山路 和希1、渕 雅音1、高木 友博1、高橋 創2、早瀬 幸彦2、海老原 靖子2、伊藤 央2、酒井 義幸2、古川 智之2 (1. 明治大学、2. 株式会社久米設計)

キーワード:画像生成、画像編集、拡散モデル、ファサードデザイン

建物のファサードデザインを決定するにあたり、建築設計者は複数のアイディアを検討し、新しいデザインを生み出すために多大な労力と時間を要している。一方、画像生成の技術は近年大きく発展しており、特にSDEditといった手法は、テキストから画像を生成する拡散モデルと組み合わせることで、簡素なイラスト画像から高品質かつクリエイティブな画像を生成することができる。しかし、この手法ではイラスト内の色とテキストの関係を結びつけることが難しく、ガラス、金属、石材など様々な材料で構成されるファサードデザイン画像を意図通りに生成・編集することは困難である。そこで我々は、色とテキストの関係を結びつけた、ファサードデザインの生成・編集手法を提案する。具体的には、学習済み拡散モデル内で使用されるAttention機構において、イラスト内の各色によって単語の重要度を変化させ、編集箇所によって参照テキスト先を切り替えることで実現する。検証から、提案手法は事前に指定したイラスト内の色とテキスト情報を十分に反映し、従来手法と比べて、より使用者の意図に沿った画像生成と編集が可能であることがわかった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード