2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1O4-GS-7] 画像音声メディア処理

2023年6月6日(火) 15:00 〜 16:40 O会場 (会議室 E1+E2)

座長:渡辺 友樹(東芝) [現地]

15:20 〜 15:40

[1O4-GS-7-02] 深層生成モデルのための可換かつ非線形な画像編集

〇青嶋 雄大1、松原 崇1 (1. 大阪大学)

キーワード:意味的画像編集、深層生成モデル

敵対的生成ネットワーク(GAN)などの深層生成モデルは高精度に画像を生成できるが,一方で画像の意味的な編集は重要な課題である.深層生成モデルの生成画像を意味的に編集するために,潜在空間における線形または非線形な意味的な経路を抽出し,これらの経路に沿って潜在変数を操作することで画像を編集する手法が提案されてきた.しかし,線形な経路を使う手法では抽出できる経路に制約が課されているため画像編集の質に限界がある.また,非線形な経路を使う手法では複数属性の可換な画像編集ができない.本研究では潜在空間における可換な属性ベクトル場を学習する手法を提案する.提案手法は複数属性の可換な画像編集と既存手法と比較してより柔軟な経路の抽出による質の高い画像編集が可能である.いくつかの事前学習済みGANを用いた実験から,実際に提案手法が複数属性の可換な画像編集と既存手法と比較してより属性ごとに分離した質の高い画像編集が可能であることを示す.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード