2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-10 AI応用

[1P1-GS-10] AI応用:一般

2022年6月14日(火) 10:00 〜 11:40 P会場 (遠隔P)

座長:真矢 滋(東芝)[遠隔]

11:00 〜 11:20

[1P1-GS-10-04] マルチモーダルなマイクロ行動分析に基づく複数人会議の定量化

〇陳 辰昊1、徳原 耕亮1、荒川 豊1、渡辺 洸2、石丸 翔也2 (1. 九州大学、2. University of Kaiserslautern & DFKI GmbH)

[[オンライン]]

キーワード:オンラインミーティング数値化、マルチモーダル、話者識別

本研究では、オンライン会議の定量評価に着目し、ミーティング中よく発生する三つのマイクロ行動「発話」、「頷き」、「笑顔」を正確に検出し、エンドツーエンドのオンライン会議定量化システムを提案する。話者認識(ASD)システムでは、音声と映像の時系列情報を抽出するエンコーダ、cross-attentionによるモーダル情報インタラクションモジュール、および長期的な発話特徴を捉えるためのself-attentionモジュールが含まれてる。頷き検出のため、頭部姿勢推定(HPE)の研究で提案されたWHENetモデルに基づいて、頭部のピッチ方向を入力特徴として、GRUによる頷き認識システムを構築する。笑顔検出はHaarカスケード分類器を用いる。K-分割交差検証法によって提案手法を評価した結果、各モジュールのF値はそれぞれ94.9%、79.67%、71.19%であった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード