JSAI2025

Presentation information

Organized Session

Organized Session » OS-20

[3D5-OS-20b] OS-20

Thu. May 29, 2025 3:40 PM - 5:20 PM Room D (Room 1202)

オーガナイザ:下西 慶(京都大学),近藤 一晃(京都大学),酒井 元気(日本大学),湯浅 将英(湘南工科大学),酒造 正樹(湘南工科大学)

4:00 PM - 4:20 PM

[3D5-OS-20b-02] Multimodal Multi-Party Models for Estimating Participant Roles in Group Discussions

〇Kazuki Kodaira1, Tatsuya Sakato1, Fumio Nihei2, Ryo Ishii2, Yukiko Nakano1 (1. Seikei University, 2. Nippon Telegraph and Telephone Corporation Human Informatics Laboratories)

Keywords:Multimodal, Multi-Party, Role estimation

グループディスカッションでの各参加者の役割は,参加者相互のインタラクションによって移り変わっていく.そこで本研究では,発言者のみではなく,他参加者の特徴も使用して,グループディスカッションにおける各参加者の役割を発話ごとに推定することを目的とする.発話ごとに参加者全員の役割ラベルが付与された4人のオンライングループ会話コーパスを用い,現在の発話と過去5発話における言語,音声,顔の特徴量を入力とし,5種類の役割を分類するBiLSTMによる深層学習モデルを作成した. モデル性能の評価実験の結果,言語モダリティのみを用いたユニモーダルモデルではマクロF1値が0.42であったのに対し,作成したマルチモーダル・マルチパーティモデルでは0.46を達成した.

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password