[2Win5-64] 拡散モデルに内在する多様体を用いた画像補間
キーワード:拡散モデル、多様体学習、画像補間、リーマン幾何学
拡散モデルは高品質な画像を生成できるが,これはデータ多様体を考慮しながら未知の分布を学習しているためと考えられている.そのため学習済み拡散モデルを解析し,データ多様体の次元数を推定する研究などが進められているが,より良い画像生成への応用は未だ十分に探求されていない.本研究では,拡散モデルの多様体構造を画像補間に応用することを提案する.具体的には,拡散モデルがスコア関数を介して多様体を学習しているという仮説のもと,リーマン幾何学の枠組みを用いて画像間の測地線を近似することで補間する.従来手法と比べて,より滑らかで自然な補間を実現できることを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。