[4Yin2-55] ユーザ発話とEntityの音声類似度を考慮したEntity Linking手法の検討
キーワード:音声対話システム、エンティティ・リンキング、音声認識
本研究では,タスク指向型音声対話システムにおけるEntity Linkingの性能を向上させることを目的として,音声特徴に基づいた類似度計算手法の比較検証を行う.Entity Linkingは,ユーザ発話と知識ベース上の各Entityとの間で類似度を計算し,ユーザ発話と最も類似するEntityを紐付けることで実現する.音声特徴を考慮してEntity Linkingを行うことで,音声認識誤りに頑健になることが期待できる.評価実験では,Automatic Speech Recognition(ASR)認識結果を使用する音素列ベースの手法(編集距離,セミグローバルアラインメント)と,ASRを使用しない,すなわち音声データを直接利用する手法(メルスペクトログラム,wav2vec 2.0)を類似度計算手法として使用し,性能の比較を行った.自社で運用している自動音声対話サービスの対話ログデータを使用して実験した結果,音素列を用いる手法の方がフィラーや無音区間の影響を受けにくく,音声データを直接利用する手法と比べて高いEntity Linking性能を示した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。