10:30 〜 12:10
[3Rin2-19] 多人数会話システムのための話者の状態変化に頑健な注視状態検出
キーワード:多人数会話、会話システム、アイコンタクト検出
多人数会話システムにおいてユーザのシステムに対する注視状態を検出する手法について検討した.多人数会話システムにとって,ユーザがシステムのことを注視しているかどうか(注視状態かどうか)を検出することは重要である.会話システムの利用時には,前処理によるノイズ(顔検出の失敗,顔特徴点推定の誤差)や人の状態の変化によるノイズ(まばたき,表情の変化,動きによるブレ)が生じるため,先行研究で行われているような単一画像を入力とする手法では注視状態を検出するのは難しい.そこで本研究では,注意機構付きのLong-Short Term Memory(LSTM)を用いた画像系列を入力とする注視状態検出手法を提案した.実際の多人数会話中の視線データを収集し評価実験を行なった結果,画像系列を入力とすることの有効性が示された.また, 提案手法によりノイズに対して頑健に注視状態を検出できることが分かった.