2024年度 人工知能学会全国大会(第38回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[3Xin2] ポスターセッション1

2024年5月30日(木) 11:00 〜 12:40 X会場 (イベントホール1)

[3Xin2-19] 大規模言語モデルとポリシー探索を用いた対話テキスト自動拡張

〇牛尾 貴志1、藤原 晴雄1、加藤 博司1、八木 豊2 (1.株式会社博報堂DYホールディングス、2.株式会社ピコラボ)

キーワード:発話理解、テキスト拡張、大規模言語モデル、ベイズ最適化

近年,リモート会議アプリを通した音声対話データの集音が容易になり,対話解析が普及しつつある.その構成技術として発話をその意図で分類する発話理解(SLU)があり,教師あり学習に基づくモデルが高い精度を持つと報告されている.
教師あり学習では,対話ドメインに応じたデータが必要であるため,低リソースやクラスが不均衡な状況における過学習問題が生じ,その対策として学習サンプルを充実させるデータ拡張が広く用いられている.しかしながら,同義語置換などの従来のデータ拡張手法では,短い文章において,変換結果が元の文意と異なり,性能向上に寄与しないことも多い.
上記課題を克服するために,我々は大規模言語モデル(LLM)を用いた複数の対話データ拡張とその組み合わせの探索方法を提案する.具体的には,操作の組み合わせを拡張ポリシーとみなし,ベイズ最適化によるポリシー探索を行い,モデル性能を向上させる. 商談対話データセットを用いた実験の結果,提案手法は,教師あり学習及びLLM ゼロショット学習を用いたベースラインを超えることが示された.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード