2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[1O4-GS-7] 画像音声メディア処理

2023年6月6日(火) 15:00 〜 16:40 O会場 (会議室 E1+E2)

座長:渡辺 友樹(東芝) [現地]

15:00 〜 15:20

[1O4-GS-7-01] 順序埋めこみを用いたエネルギーベースモデルによる概念合成

〇末吉 耕大1、松原 崇1 (1. 大阪大学)

キーワード:深層学習、エネルギーベースモデル

エネルギーベースモデル(EBM)は深層生成モデルの1つであり,エネルギー関数の計算にニューラルネットワークを利用し,尤度最大化によるデータ分布の学習を可能にする.EBMは他の生成モデルに比べ,ネットワークの設計が柔軟であることなどの利点が挙げられる.EBMによる概念合成の分野では,概念の独立性という仮定を置いた上で,各概念に対応するエネルギー関数の総和によって複数の概念が指定された画像生成ができることが先行研究で知られている.一方で,実際は概念は独立ではないため,この仮定によって生成するデータの多様性が欠如する恐れがある.そこで本研究では,概念の独立性を仮定せずに複数概念が指定された画像生成手法を提案する.具体的には順序埋め込み(order embedding)という手法で概念情報を潜在空間に埋め込む.順序関係を保存した潜在空間上で概念の埋めこみ座標同士のmax演算をとることで,概念の組み合わせを指定した画像生成が期待される.実験により,提案手法による複数概念を持つ画像が生成されることが確認できた.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード