10:20 〜 10:40
[3R1-OS-45-05] タスク指向対話システムにおける全モジュールの後処理の同時最適化
キーワード:タスク指向型対話システム 、言語モデル、強化学習
後処理ネットワーク(Post-Processing Network; PPN)は,タスク指向対話システムにおけるモジュールの出力を修正するコンポーネントであり,システムの全体的なタスク達成能力を改善する.しかし,従来のPPNは,システム内の一部のモジュールのみを扱うことに限定されており,システム性能の向上に大きな制約となっていた.本研究では,Universal Post-Processing Network(UniPPN)を用いて,全モジュールの出力の後処理を同時に最適化する手法を提案する.UniPPNは,単一の言語モデルであり,システム内の任意のモジュールの出力を系列変換タスクとして処理することが可能である.本稿では,UniPPN の強化学習アルゴリズムの詳細について述べるとともに,MultiWOZデータセットを用いたシミュレーション実験および人手評価実験を通じて,UniPPNが従来のPPNと比較して優れた性能を示すことを実証する.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。