10:30 〜 12:10
[3Rin2-32] 機械学習を用いた構音障害分類における音声特徴量間の耐ノイズ性能の比較
キーワード:機械学習、音声認識、構音障害
コミュニケーションロボットの開発の際,人とロボットの間の円滑なコミュニケーションにおいて非言語情報が非常に重要な役割を果たすため,多彩な生体情報を含んだ人間の声を解析することが必要となる.
ロボットを介して得られた音声を機械学習で解析するためには,声に付加されたノイズの存在を考慮する必要があるものの,
従来使われてきた音声特徴量の中にはノイズのことが考慮されずに使用されているものが存在する.
今回,音声にノイズが含まれた際に分類精度が変動するかを検証するため,構音障害の分類問題を初期検討として,従来提案されてきた構音障害の度合いを表す指標を用いた分類と,メル尺度ケプストラム特徴量(MFCC)を用いた分類を比較した.
実験の結果,MFCCを用いた場合,含まれるノイズにかかわらず正確な分類が行えた一方,従来提案されてきた構音障害の度合いを表す指標では,ノイズが悪影響を及ぼすことが明らかとなった.
ロボットを介して得られた音声を機械学習で解析するためには,声に付加されたノイズの存在を考慮する必要があるものの,
従来使われてきた音声特徴量の中にはノイズのことが考慮されずに使用されているものが存在する.
今回,音声にノイズが含まれた際に分類精度が変動するかを検証するため,構音障害の分類問題を初期検討として,従来提案されてきた構音障害の度合いを表す指標を用いた分類と,メル尺度ケプストラム特徴量(MFCC)を用いた分類を比較した.
実験の結果,MFCCを用いた場合,含まれるノイズにかかわらず正確な分類が行えた一方,従来提案されてきた構音障害の度合いを表す指標では,ノイズが悪影響を及ぼすことが明らかとなった.