LLM-based Data Augmentation for Named Entity Recognition in Japanese

Hikari Okazaki; Katsuhito Sudoh

[1Win4-41] LLM-based Data Augmentation for Named Entity Recognition in Japanese

〇Hikari Okazaki¹, Katsuhito Sudoh¹ (1.Nara Women's University)

Keywords:Large Language Models

固有表現抽出の精度を向上させることは文章の要約や情報検索などのテキストを扱うツールの改良に役立つが、日本語の固有表現抽出精度は英語のものと比較すると一般に精度が劣る傾向にある。本研究では日本語の固有表現抽出の精度を向上させるため、大規模言語モデル(LLM)を利用したデータ拡張を行った。LLMによって元データの固有表現を同じ種類の異なる固有表現に置換したデータを生成し、生成されたデータの一部あるいは全部を元データと組み合わせた拡張データを作成する。このデータを用いて固有表現抽出を実行し、評価を行った。結果として、固有表現クラスによってはデータ拡張の効果の差が認められた。

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Presentation information

[1Win4] Poster session 1

[1Win4-41] LLM-based Data Augmentation for Named Entity Recognition in Japanese

Password