2025年度 人工知能学会全国大会(第39回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[3G5-GS-6] 言語メディア処理:

2025年5月29日(木) 15:40 〜 17:20 G会場 (会議室1002)

座長:橋本 真幸 (東洋大学)

16:00 〜 16:20

[3G5-GS-6-02] 音声アクティビティ予測を利用した音声対話システムの構築と自然さの客観評価

〇樋口 栄作1、山本 智幸1、吉田 茂人1 (1. シャープ株式会社)

キーワード:大規模言語モデル、対話システム、ターンテイキング、自然言語処理、あいづち

自然言語処理技術の進展に伴い,連続音声を扱う対話システムが普及しつつある.特にあいづちを打つ対話システムの応答は,応答速度の遅延や発話中の割り込みにより自然な会話を損なうが,あいづちと本文の分離が困難のため評価が難しい.本研究では,あいづちを含む自然なやりとりを実現するため,ターンテイキングに着目し,VAP(Voice Activity Projection)を応用した対話システムを構築した.会話の開始終了時刻を予測し,あいづちや割り込み発話を区別可能にする.実験により自然さの向上が確認され,今後の対話システム開発において有効となることを確認した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード