[3Rin4-59] 画像変換手法による音声強調のためのスペクトログラム変換
キーワード:deep learning、音源強調、画像変換
本研究の目的は、深層学習を用いた画像変換手法としてよく知られたpix2pixの改良を加えることである.
時空間分析に着目し,auxiliary classifier generative adversarial networks (ACGAN)を実装した.
そして,音声強調のため,スペクトログラムの変換を評価した.
画像評価指標SSIMを指標として用いた結果,先行研究よりわずかに結果が向上したことを確認した.
時空間分析に着目し,auxiliary classifier generative adversarial networks (ACGAN)を実装した.
そして,音声強調のため,スペクトログラムの変換を評価した.
画像評価指標SSIMを指標として用いた結果,先行研究よりわずかに結果が向上したことを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。