2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 9.自然言語処理・情報検索

[3G2] 自然言語処理-文書構造解析

2018年6月7日(木) 15:50 〜 17:30 G会場 (5F ルビーホール飛天)

座長:西田 京介(NTT)

16:50 〜 17:10

[3G2-04] 音声認識誤りに頑健なニューラル発話意図推定のためのコンフュージョンネットワークの連続表現

〇増村 亮1、井島 勇祐1、浅見 太一1、政瀧 浩和1、東中 竜一郎1 (1. 日本電信電話株式会社)

キーワード:発話意図推定

本稿では,音声認識誤りに頑健な発話意図推定を目指して,音声認識時の複数仮説表現であるコンフュージョンネットワークを直接ニューラルネットワークの枠組みで扱うことが可能なモデル化手法を提案する.提案手法のポイントは,コンフュージョンネットワークを連続表現に変換することであり,その際に注意機構を利用した修正重み付き和表現を用いることで,仮説内の単語の重要性と音声認識時の信頼度を両者を考慮した上で全体最適化を実現する.実験から,提案手法はn-best を用いる方法よりも声認識誤りに頑健に動作することを示す.