[2Win5-61] 音楽的制約を用いた音声合成の制御
キーワード:音声合成
本研究では,音楽的制約を取り入れた音声合成の制御により,感情や印象を反映した自然な音声生成を目指す.Style-Bert-VITS2を用いて,書き起こし文に音高の音楽的要素を付与する方法を提案する.モデルの学習には,日本語歌声コーパス(PJS)と日本語話し言葉コーパス(CSJ)を組み合わせ,音高の制約を学習データに反映させる前処理を行った.実験の結果,音楽的制約を付与した箇所で制約に近い音声を生成することができた.今後は,メロディやテンポなどの多様な制約条件を加えることで,さらなる表現力向上が期待される.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。