2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-13 インタラクションとAI

[3R1-OS-13b] インタラクションとAI

2024年5月30日(木) 09:00 〜 10:40 R会場 (51研修交流室)

オーガナイザ:酒井 元気(日本大学)、岡田 将吾(北陸先端科学技術大学院大学)、湯浅 将英(湘南工科大学)、近藤 一晃(京都大学)、下西 慶(京都大学)

10:00 〜 10:20

[3R1-OS-13b-04] 言語,表情,音声情報を用いた動機づけ面接における発話の分類

田中 智也1、坂戸 達陽2、〇中野 有紀子2 (1. 成蹊大学大学院理工学研究科、2. 成蹊大学)

キーワード:動機づけ面接、マルチモーダルインタラクション、分類

カウンセリング手法の一種に動機づけ面接(MI:Motivational Interviewing)がある.MIでは,クライアント自身の行動変容の理由を引き出すことを目的としている.本研究では,MIのカウンセラー(CO)の発話に注目した.MIではMotivatinal Interviewing Skill Code(MISC)というコーディングスキームが確立されている.使用するコーパスのカウンセラー発話をMISCでアノテーションした.さらにラベルをマージし,新たに11種類のラベルを作成し,11クラス分類問題を定義した.本研究では,大規模言語モデル(LLM)を用いた分類問題というアプローチを採用した.LLMは言語モデルであるため入力には言語を用いるのが一般である.本研究では表情と音声の情報をエンベディングし,得られたベクトルを言語情報とみなしLLMへの入力に使用する手法を提案する.さらに,BERTをマルチモーダル化しCOラベルの分類を行うモデルも提案する.実験の結果,要約を表すラベルについて先行研究と比較して約29%性能が向上することを示した.またアンバランスなデータが与える影響について議論した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード