2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-7 画像音声メディア処理

[2O4-GS-7] 画像音声メディア処理:一般

2022年6月15日(水) 13:20 〜 15:00 O会場 (Room 510)

座長:岡部 浩司(NEC)[遠隔]

14:40 〜 15:00

[2O4-GS-7-05] カエルの合唱音声に対する教師ありモノラル音源分離のためのスペクトル構造を用いたデータ拡張

〇生嶋 竜実1、武田 龍1、合原 一究2、駒谷 和範1 (1. 大阪大学、2. 筑波大学)

[[オンライン]]

キーワード:モノラル音源分離、深層学習、データ拡張、カエル、周波数スペクトル

カエルの合唱において,個体間の相互作用などの解析には,混合音から個体の鳴き声を分離する音源分離が必要である.特に,野外ではカエルが群れで密集している場合や,マイクとの位置の関係が不明な場合がある.このような条件での分離には教師ありモノラル音源分離が有望である.音源分離モデルの学習には,多数の鳴き声データが必要である.一方,学習データのために鳴き声を収集するのは困難で,多数の個体を捕獲し各個体の鳴き声を録音する必要がある.本研究では,少数の鳴き声データを使用し,鳴き声の特徴に注目したデータ拡張を行う.鳴き声は個体の大きさや気温により,周波数や発声間隔などに相違が見られるという特徴が知られている.まず,鳴き声の個体内や個体間のスペクトル構造といった特徴を分析する.次に,分析結果に基づき,鳴き声の基本周波数の変調や時間伸縮を行い学習データ内の鳴き声のパターンを増やす.データ拡張した鳴き声を用いて,2匹のカエルの音源分離実験を行った.データ拡張の有無により,分離精度向上への有効性を信号対歪比で確認した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード