2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-10 画像・音声

[3N3-J-10] 画像・音声: 声とコミュニケーション

2019年6月6日(木) 13:50 〜 14:30 N会場 (1F 展示ホール右奥)

座長:辻川 剛範(NEC) 評者:杉浦 純(ヤフー)

13:50 〜 14:10

[3N3-J-10-01] 音声からの感情推定における転移学習を用いた多言語補填

〇坂口 巧一1、加藤 昇平1,2 (1. 名古屋工業大学大学院工学研究科情報工学専攻、2. 名古屋工業大学情報科学フロンティア研究院)

キーワード:多言語補填、感情音声

近年,ロボティクス技術とAI の発展に伴い人と音声対話するロボットが注目を集めている.音声から感情を推定する技術はロボットが人と円滑な対話を実現するために重要である.音声から感情を推定する技術には大量の感情音声データが必要であるが,感情音声データを大量に集めることは難しい.私たちは、転移学習による多言語補填の妥当性について調査した.その結果を本稿で示す.その結果から,学習する言語数を増加させることで,1つの言語の不十分な感情音声について学習したモデルの分類性能を超える可能性が示唆された.