[4Xin2-34] 朗読音声合成におけるポーズ長分布の多様性を吸収するための標準化の効果
キーワード:朗読音声合成、ポーズ長推定、標準化、自然言語処理
朗読音声では,作品や朗読者,また地の文か会話文か等の差異によりポーズ長分布に異なりがある.そこで本研究では,朗読対象のテキストに基づきポーズ位置およびポーズ長を予測するための学習の際に,訓練データにおけるポーズ長を標準化することで分布の差異を吸収することを試みた.その結果,朗読作品ごとの標準化,地の文・会話文に分けた上での標準化など, いくつかの正規化の方法のうち,朗読作品ごとの標準化が最も有効であることがわかった.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。