第24回画像センシングシンポジウム

講演情報

オーガナイズドセッション

[OS2] オーガナイズドセッション2「マルチモーダル深層学習:画像認識を越えて広がる世界 ~画像・自然言語・音声の共創~」

2018年6月14日(木) 10:35 〜 12:05 メインホール (アネックスホール2F)

オーガナイザー:中山 英樹(東京大学)

11:30 〜 11:50

[OS2-04] モダリティ変換と画像生成

*加藤 大晴1 (1. 東京大学)

深層学習によるエンコーダ・デコーダを用いたモダリティの変換は、機械翻訳(言語→他言語)で成功を収めたのち、画像の説明文の生成(画像→言語)や音声認識(音声→言語)などへと展開されてきました。この枠組みを用いて画像を生成する、つまり深層学習で画像デコーダを実現することはできるのでしょうか? 本講演では、このような観点から近年の画像生成手法の動向と私たちの取り組みを紹介します。

抄録パスワード認証
抄録の閲覧にはパスワードが必要です。パスワードを入力して認証してください。

受付時にパスワードを配布いたします。

パスワード