[4Xin2-49] 金融・証券記事における表構造を含んだテキストに対する組織名抽出
キーワード:固有表現抽出、自然言語処理
ニュース記事に含まれる組織名抽出モデルでは、一般的で自然なテキストに対するデータにおいては一定程度の成果をあげている。しかし、ニュース記事の中でも金融や証券領域の記事では、数値で書かれた企業コードや表構造に整理されている内容が含まれていることが多い。これまでの固有表現抽出では、構造化データや企業を表すコード(数値情報)が混在したテキストを扱うことは少なく、抽出は難しかった。本研究では、機械的に構成したこれらの構造化データを含むテキストデータを学習させ、既存の組織名抽出の精度を落とさずに、構造化データでの抽出性能を持たせることに成功した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。