[2Yin5-03] エンティティの類似度を考慮したデータ拡張による質問カテゴリ推定
キーワード:対話システム、データ拡張、エンティティ
本研究では,エンティティに着目したデータ拡張を行う際に,エンティティ間の類似度を考慮することで高品質なデータ生成を目指す.本研究で取り組む質問文の質問カテゴリ推定タスクにおいて,高性能なモデル構築には多様な表現を含む大量の学習データが必要となる.その際,学習用データの収集や正解カテゴリのアノテーションのコストを軽減するため,データ拡張によるデータの自動生成を行う.提案手法ではシードとなる質問中のエンティティを類似エンティティと置換することで新たな質問を生成する.提案手法によって自動生成された質問の品質を評価するため,質問カテゴリ分類タスクの精度評価を行った.評価実験の結果,エンティティの類似度を考慮することで分類精度の向上が確認された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。