2024年度 人工知能学会全国大会(第38回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[4Xin2] ポスターセッション2

2024年5月31日(金) 12:00 〜 13:40 X会場 (イベントホール1)

[4Xin2-49] 金融・証券記事における表構造を含んだテキストに対する組織名抽出

山内 洋輝2,1、〇田村 光太郎1 (1.株式会社ユーザベース、2.愛媛大学)

キーワード:固有表現抽出、自然言語処理

ニュース記事に含まれる組織名抽出モデルでは、一般的で自然なテキストに対するデータにおいては一定程度の成果をあげている。しかし、ニュース記事の中でも金融や証券領域の記事では、数値で書かれた企業コードや表構造に整理されている内容が含まれていることが多い。これまでの固有表現抽出では、構造化データや企業を表すコード(数値情報)が混在したテキストを扱うことは少なく、抽出は難しかった。本研究では、機械的に構成したこれらの構造化データを含むテキストデータを学習させ、既存の組織名抽出の精度を落とさずに、構造化データでの抽出性能を持たせることに成功した。

要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン