14:40 〜 15:00
[4D3-GS-6-03] 文書内におけるラベルの一貫性を考慮した固有表現抽出手法の提案
キーワード:固有表現抽出、匿名化、機械学習
文書内における個人情報の匿名化や情報抽出などを目的に固有表現を抽出しようとする際、機械学習をはじめとする統計的アプローチでは、類似表記に対して異なるラベルが付与されることがある。同一のラベルを一貫して付与する方が望ましい場合、それを判定できれば、ラベル付与の精度を改善できる。
本研究はこのような固有表現の一貫性を判定する手法を提案する。拡張固有表現タグ付きコーパスを用いた実験では、ベースラインから精度の向上を確認した。
本研究はこのような固有表現の一貫性を判定する手法を提案する。拡張固有表現タグ付きコーパスを用いた実験では、ベースラインから精度の向上を確認した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。