画像キャプションに対する表現学習に向けた敵対的生成ネットワーク

阿部 佑樹

10:30 〜 12:10

[3Rin2-30] 画像キャプションに対する表現学習に向けた敵対的生成ネットワーク

〇阿部佑樹¹、妹尾卓磨¹、松森匠哉¹、今井倫太¹ (1. 慶應義塾大学)

キーワード：表現学習、敵対的生成ネットワーク、画像キャプショニング

ひとつの画像から生成されるキャプションは、表現（例えば注意点または文章表現）に関して互いに異なることが考えられる。しかし、世界中の膨大な量の画像キャプションのデータセットには、潜在変数のアノテーションはほとんどまたはまったく付けられていない。教師なしで画像キャプションの潜在変数を学習することは、条件付き画像キャプショニングの拡張性および解釈可能性の観点から重要である。本研究では、画像キャプションの潜在変数を学習し活用するための深層生成モデルを提案する。実験では、画像キャプショニングの縮小設定として、複数のMNIST画像と正解ラベルを用いた画像分類問題を使用し、本提案モデルがラベルのサブグループを表す潜在変数を獲得したことを示す。

講演情報

[3Rin2] インタラクティブセッション１

[3Rin2-30] 画像キャプションに対する表現学習に向けた敵対的生成ネットワーク