[3Yin2-37] speak like a dog!
深層学習によるノンパラレル音声変換を用いた犬声合成
キーワード:音声変換
本研究では,言語情報を保持したまま,人間の音声を犬のような音声に変換する方法を提案する.
ボードゲームの一種にテーブルトーク・ロールプレイングゲーム (TRPG) があり,そこにはゴブリンやゾンビなど様々な空想上の生物が登場する.
このような空想上の生物の声を表現するために、音声変換の利用が期待できる.
この目標を達成するために、2つの音声特徴量 (mel-cepstral coefficientsとmel-spectrogram) と2つのノンパラレル音声変換手法 (Variational autoencoder basedとgenerative adversarial network based) ,5つのカーネルサイズの比較実験を行った.
人間の声を断片的に犬の声に変換することはできたが,言語情報を保持することは難しく,さらなる改良が必要である.
ボードゲームの一種にテーブルトーク・ロールプレイングゲーム (TRPG) があり,そこにはゴブリンやゾンビなど様々な空想上の生物が登場する.
このような空想上の生物の声を表現するために、音声変換の利用が期待できる.
この目標を達成するために、2つの音声特徴量 (mel-cepstral coefficientsとmel-spectrogram) と2つのノンパラレル音声変換手法 (Variational autoencoder basedとgenerative adversarial network based) ,5つのカーネルサイズの比較実験を行った.
人間の声を断片的に犬の声に変換することはできたが,言語情報を保持することは難しく,さらなる改良が必要である.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。