The 24th Symposium on Sensing via Image Information

Presentation information

オーガナイズドセッション

[OS2] オーガナイズドセッション2「マルチモーダル深層学習:画像認識を越えて広がる世界 ~画像・自然言語・音声の共創~」

Thu. Jun 14, 2018 10:35 AM - 12:05 PM MAIN HALL (ANNEX HALL 2F)

オーガナイザー:中山 英樹(東京大学)

11:10 AM - 11:30 AM

[OS2-03] テキスト・画像から音声への変換

*滝口 哲也1 (1. 神戸大学)

本講演では、深層学習によるテキストから音声への変換(テキスト音声合成)の応用研究例として、発話障害者のコミュニケーション支援を目指した聞き取り困難な音声を聞き取り容易な音声に変換する音声合成を紹介します。また画像から音声への変換として、唇画像から音声への変換、及びハイスピード映像中の微小振動から音声への変換を紹介します。最後にこれらの技術の今後の展望について概説します。

Abstract password authentication.
Password is required to view the abstract. Please enter a password to authenticate.

Password