2024年度 人工知能学会全国大会(第38回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[4Xin2] ポスターセッション2

2024年5月31日(金) 12:00 〜 13:40 X会場 (イベントホール1)

[4Xin2-34] 朗読音声合成におけるポーズ長分布の多様性を吸収するための標準化の効果

〇竹下 隼司1、松崎 拓也1 (1.東京理科大学)

キーワード:朗読音声合成、ポーズ長推定、標準化、自然言語処理

朗読音声では,作品や朗読者,また地の文か会話文か等の差異によりポーズ長分布に異なりがある.そこで本研究では,朗読対象のテキストに基づきポーズ位置およびポーズ長を予測するための学習の際に,訓練データにおけるポーズ長を標準化することで分布の差異を吸収することを試みた.その結果,朗読作品ごとの標準化,地の文・会話文に分けた上での標準化など, いくつかの正規化の方法のうち,朗読作品ごとの標準化が最も有効であることがわかった.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード