[1Win4-24] Generating Training Data with Diverse Action Distributions for Web Agents
Keywords:Web Agent, Large Language Model
Web エージェントは,Web ブラウザを操作することで与えられたタスクを自動実行するシステムであり,日常業務の効率化が期待されている.Web エージェントの学習には,タスクとアクション列のペアを教師データとして用いるが,人手によるデータ収集は高コストであるため,大規模言語モデル(LLM)を活用した教師データ生成が注目されている.従来手法ではタスクを先に作成し,LLM にアクションを生成させるが,この方法ではタスクに依存した特定のアクションの出力が増え,分布に偏りが生じ,Web エージェントの性能低下を招く可能性がある.本研究では,タスクを与えない状態でアクション生成を行い,その後で適切なタスク名を付与する教師データ生成手法を提案する.ベンチマークデータセットを用いた実験の結果,提案手法で生成したデータで学習した Web エージェントは従来手法を上回る性能を示した.また,教師データ内のアクション多様性と性能の関係を分析し,最適なアクション分布の存在が確認された.
Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.