2022年度 人工知能学会全国大会(第36回)

講演情報

インタラクティブセッション

一般セッション » インタラクティブセッション

[4Yin2] インタラクティブセッション2

2022年6月17日(金) 12:00 〜 13:40 Y会場 (Event Hall)

[4Yin2-55] ユーザ発話とEntityの音声類似度を考慮したEntity Linking手法の検討

〇邊土名 朝飛1、戸田 隆道1、友松 祐太1、杉山 雅和1、東 佑樹1、下山 翔1 (1.株式会社AI Shift)

キーワード:音声対話システム、エンティティ・リンキング、音声認識

本研究では,タスク指向型音声対話システムにおけるEntity Linkingの性能を向上させることを目的として,音声特徴に基づいた類似度計算手法の比較検証を行う.Entity Linkingは,ユーザ発話と知識ベース上の各Entityとの間で類似度を計算し,ユーザ発話と最も類似するEntityを紐付けることで実現する.音声特徴を考慮してEntity Linkingを行うことで,音声認識誤りに頑健になることが期待できる.評価実験では,Automatic Speech Recognition(ASR)認識結果を使用する音素列ベースの手法(編集距離,セミグローバルアラインメント)と,ASRを使用しない,すなわち音声データを直接利用する手法(メルスペクトログラム,wav2vec 2.0)を類似度計算手法として使用し,性能の比較を行った.自社で運用している自動音声対話サービスの対話ログデータを使用して実験した結果,音素列を用いる手法の方がフィラーや無音区間の影響を受けにくく,音声データを直接利用する手法と比べて高いEntity Linking性能を示した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード