2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1O1-GS-7] 画像音声メディア処理:GAN

2022年6月14日(火) 10:00 〜 11:40 O会場 (Room 510)

座長:岩澤 有祐(東京大学)[現地]

10:40 〜 11:00

[1O1-GS-7-03] Conditional FastGANと色彩心理効果の活用による非言語的印象情報に基づく生成画像の制御

〇蛭田 興明1、齋藤 隆丞1、畠山 太郎1、橋本 敦史1,2、栗原 聡1 (1. 慶應義塾大学、2. オムロンサイニックエックス株式会社)

キーワード:深層生成モデル、条件付き敵対的生成ネットワーク、印象特徴空間、色彩心理、漫画

漫画やゲームなどの面白いコンテンツを成立させる要件の一つとして,魅力的なキャラクターをデザインすることが挙げられる.魅力的なキャラクターは,言葉で表せない直感的なひらめきによって生み出される場合がある.発想の源泉となる珠玉のひらめきを意図して出せるようにするためにはどのようにしたらよいだろうか? 本研究では,非言語的な印象情報に基づいて生成画像を制御することで,クリエイターの発想力拡張の一助とすることを目標とする.まずは芸術作品などの小規模データセットでも高品質なデータを生成できるConditional FastGANを提案する.加えて,人が画像から受ける「印象」を特徴量として抽出するために,非言語的な印象媒体として「色」を活用したアノテーションシステムを構築した.実験では小規模データセットとして,手塚治虫作品から抽出した漫画顔画像と,多様な向きの顔写真からなるMUCTデータセット,およびシステムによって得られた色に基づいた印象情報データセットを用いた.その結果,実写と漫画や印象の条件に対応した画像生成が可能となった.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード