2022年度 人工知能学会全国大会(第36回)

講演情報

インタラクティブセッション

一般セッション » インタラクティブセッション

[3Yin2] インタラクティブセッション1

2022年6月16日(木) 11:30 〜 13:10 Y会場 (Event Hall)

[3Yin2-37] speak like a dog!

深層学習によるノンパラレル音声変換を用いた犬声合成

〇鈴木 公平1、阪本 翔紀1、谷口 忠大1、亀岡 弘和2 (1.立命館大学、2.NTT コミュニケーション科学基礎研究所)

キーワード:音声変換

本研究では,言語情報を保持したまま,人間の音声を犬のような音声に変換する方法を提案する.
ボードゲームの一種にテーブルトーク・ロールプレイングゲーム (TRPG) があり,そこにはゴブリンやゾンビなど様々な空想上の生物が登場する.
このような空想上の生物の声を表現するために、音声変換の利用が期待できる.
この目標を達成するために、2つの音声特徴量 (mel-cepstral coefficientsとmel-spectrogram) と2つのノンパラレル音声変換手法 (Variational autoencoder basedとgenerative adversarial network based) ,5つのカーネルサイズの比較実験を行った.
人間の声を断片的に犬の声に変換することはできたが,言語情報を保持することは難しく,さらなる改良が必要である.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード