タスク指向対話システムにおける全モジュールの後処理の同時最適化

大橋 厚元

10:20 〜 10:40

[3R1-OS-45-05] タスク指向対話システムにおける全モジュールの後処理の同時最適化

〇大橋厚元¹、東中竜一郎¹ (1. 名古屋大学)

キーワード：タスク指向型対話システム、言語モデル、強化学習

後処理ネットワーク（Post-Processing Network; PPN）は，タスク指向対話システムにおけるモジュールの出力を修正するコンポーネントであり，システムの全体的なタスク達成能力を改善する．しかし，従来のPPNは，システム内の一部のモジュールのみを扱うことに限定されており，システム性能の向上に大きな制約となっていた．本研究では，Universal Post-Processing Network（UniPPN）を用いて，全モジュールの出力の後処理を同時に最適化する手法を提案する．UniPPNは，単一の言語モデルであり，システム内の任意のモジュールの出力を系列変換タスクとして処理することが可能である．本稿では，UniPPN の強化学習アルゴリズムの詳細について述べるとともに，MultiWOZデータセットを用いたシミュレーション実験および人手評価実験を通じて，UniPPNが従来のPPNと比較して優れた性能を示すことを実証する．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[3R1-OS-45] 知的対話システム

[3R1-OS-45-05] タスク指向対話システムにおける全モジュールの後処理の同時最適化

パスワード