第24回画像センシングシンポジウム

講演情報

オーガナイズドセッション

[OS2] オーガナイズドセッション2「マルチモーダル深層学習:画像認識を越えて広がる世界 ~画像・自然言語・音声の共創~」

2018年6月14日(木) 10:35 〜 12:05 メインホール (アネックスホール2F)

オーガナイザー:中山 英樹(東京大学)

11:10 〜 11:30

[OS2-03] テキスト・画像から音声への変換

*滝口 哲也1 (1. 神戸大学)

本講演では、深層学習によるテキストから音声への変換(テキスト音声合成)の応用研究例として、発話障害者のコミュニケーション支援を目指した聞き取り困難な音声を聞き取り容易な音声に変換する音声合成を紹介します。また画像から音声への変換として、唇画像から音声への変換、及びハイスピード映像中の微小振動から音声への変換を紹介します。最後にこれらの技術の今後の展望について概説します。

抄録パスワード認証
抄録の閲覧にはパスワードが必要です。パスワードを入力して認証してください。

受付時にパスワードを配布いたします。

パスワード