[1Win4-41] LLM-based Data Augmentation for Named Entity Recognition in Japanese
Keywords:Large Language Models
固有表現抽出の精度を向上させることは文章の要約や情報検索などのテキストを扱うツールの改良に役立つが、日本語の固有表現抽出精度は英語のものと比較すると一般に精度が劣る傾向にある。本研究では日本語の固有表現抽出の精度を向上させるため、大規模言語モデル(LLM)を利用したデータ拡張を行った。LLMによって元データの固有表現を同じ種類の異なる固有表現に置換したデータを生成し、生成されたデータの一部あるいは全部を元データと組み合わせた拡張データを作成する。このデータを用いて固有表現抽出を実行し、評価を行った。結果として、固有表現クラスによってはデータ拡張の効果の差が認められた。
Please log in with your participant account.
» Participant Log In