[3Xin2-38] U-Net内の中間表現操作による生成画像の一貫性を確保する手法の検討
キーワード:画像生成
Stable Diffusionの登場から画像生成が急激に注目を集め始めている. その中でも画像生成を用いた動画制作への関心が高まっている. 画像生成を用いた動画制作の大きな壁の一つに画像の一貫性の確保が難しいことが挙げられる. これを改善する手法の多くが入力やタスクに応じた再学習をしており既存の技術との併用が難しい場合もある. そこで本研究では再学習を必要とせず画像の一貫性を確保する手法について検討した. 本研究の提案手法は, 画像の生成中のU-Net内の中間表現を保存し, その結果を別の画像の生成時に直接利用し操作を行うものである. 異なる二種のボトムスを着用した画像を生成するタスクを行い画像の一貫性を検証した. 視覚評価と数値評価の結果, 構図や背景の変化を抑制することができた.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。