[2Xin5-22] Contextual Attention を用いたスペクトログラムの復元
キーワード:音声、深層学習、画像修復
オンライン会議などにおいて,深層学習を用いて音声のノイズを取り除き高音質化する技術や,リアルタイムに声質を変換するシステムの実装化が進んでいる.また,コンピュータービジョンの分野においても近年,深層学習を用いたInpainting技術が発展している.本研究では特にContextual Attentionを用いたInpainting技術を用いてスペクトログラムの復元を行う.スペクトログラムの時間方向にマスクを施し,マスク以外の部分よりスペクトログラムが復元可能であるか検討する.提案手法として,スペクトログラムに対して周波数方向のグラデーションを与えることで音声修復の精度を向上させる手法を提案する.結果,提案手法を用いることでMel-cepstral Distortionの値を改善させることができた.加えて周波数方向のAttentionの改善が行われたことが,Attention Mapより証明された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。