2021年度 人工知能学会全国大会(第35回)

講演情報

インタラクティブセッション

一般セッション » インタラクティブセッション

[2Xin5] インタラクティブ1

2021年6月9日(水) 17:20 〜 19:00 X会場 (ポスター会場1)

[2Xin5-22] Contextual Attention を用いたスペクトログラムの復元

〇羽原 俊輔1、黒澤 義明1、目良 和也1、竹澤 寿幸1 (1.広島市立大学大学院情報科学研究科)

キーワード:音声、深層学習、画像修復

オンライン会議などにおいて,深層学習を用いて音声のノイズを取り除き高音質化する技術や,リアルタイムに声質を変換するシステムの実装化が進んでいる.また,コンピュータービジョンの分野においても近年,深層学習を用いたInpainting技術が発展している.本研究では特にContextual Attentionを用いたInpainting技術を用いてスペクトログラムの復元を行う.スペクトログラムの時間方向にマスクを施し,マスク以外の部分よりスペクトログラムが復元可能であるか検討する.提案手法として,スペクトログラムに対して周波数方向のグラデーションを与えることで音声修復の精度を向上させる手法を提案する.結果,提案手法を用いることでMel-cepstral Distortionの値を改善させることができた.加えて周波数方向のAttentionの改善が行われたことが,Attention Mapより証明された.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード