テキスト・画像から音声への変換

滝口 哲也

11:10 〜 11:30

[OS2-03] テキスト・画像から音声への変換

*滝口哲也¹ (1. 神戸大学)

本講演では、深層学習によるテキストから音声への変換（テキスト音声合成）の応用研究例として、発話障害者のコミュニケーション支援を目指した聞き取り困難な音声を聞き取り容易な音声に変換する音声合成を紹介します。また画像から音声への変換として、唇画像から音声への変換、及びハイスピード映像中の微小振動から音声への変換を紹介します。最後にこれらの技術の今後の展望について概説します。

抄録パスワード認証
抄録の閲覧にはパスワードが必要です。パスワードを入力して認証してください。

受付時にパスワードを配布いたします。

講演情報

[OS2] オーガナイズドセッション2「マルチモーダル深層学習：画像認識を越えて広がる世界～画像・自然言語・音声の共創～」

[OS2-03] テキスト・画像から音声への変換

パスワード

講演情報

[OS2] オーガナイズドセッション2「マルチモーダル深層学習：画像認識を越えて広がる世界 ～画像・自然言語・音声の共創～」

[OS2-03] テキスト・画像から音声への変換

パスワード

[OS2] オーガナイズドセッション2「マルチモーダル深層学習：画像認識を越えて広がる世界～画像・自然言語・音声の共創～」