2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 10.画像・音声

[2N1] 画像・音声-音声システム

2018年6月6日(水) 09:00 〜 10:20 N会場 (2F 桜島)

座長:辻川 剛範(NEC)

09:20 〜 09:40

[2N1-02] 音声対話システムにおける対話の状況を利用した応答タイミング推定

〇赤井 元紀1、武田 龍1、駒谷 和範1 (1. 大阪大学産業科学研究所)

キーワード:音声対話システム、応答タイミング、ターンテイキング、相槌

音声対話システムでは適切なタイミングで応答することが重要である.従来の対話システムでは,状況によらずに同じように応答タイミングが決められる.これに対して,新たに対話の状況を導入することで,状況に応じて応答タイミングを推定する.本研究では,複数の処理単位を用いて現在の対話の状況と応答タイミングのそれぞれに特化した推定を行うことで,状況に応じた適切な応答タイミングを推定する.応答タイミングの推定の評価に使用するデータとして,ユーザとシステムとのインタビュー形式の対話における7名のユーザの回答音声を収集した.収集したデータを用いて,応答タイミングの推定における対話の状況の利用の有無による性能の変化を評価した.応答タイミングの推定に識別モデルと回帰モデルを用いた場合についてそれぞれ評価した結果,回帰モデルに関しては対話の状況を利用することで正解率が約9ポイント上昇した.