[OS2-02] 3次元・マルチモーダル音環境認識
近年の深層学習の発展とともに、音声認識をはじめとした音イベントの認識は圧倒的な性能を達成しつつある。また、遮蔽物を迂回し伝搬する特性を活用した環境認識・計測のため、音源位置(方向)の定位などが広く研究されている。このような認識と定位の結果を SLAM 技術と統合し空間的な音源地図推定を行ったり、音響情報と視覚情報と統合して教師なしで認識や分離を学習したりする研究が盛んである。さらに、これらの一部はオープンソース・ソフトウェアとして公開もされており、手軽に利用できつつある。本講演では、音環境の認識や3Dセンシングといった音響信号処理技術について、分類と位置づけを行いながら解説する。
抄録パスワード認証
受付時にパスワードを配布いたします。