[4Xin1-03] 固有表現抽出によるニューステキスト内の企業名抽出
キーワード:自然言語処理、固有表現抽出、人工知能
株式会社ユーザベースが提供する経済情報プラットフォーム「SPEEDA」保有のニューステキストデータを利用し、本文に含まれる企業情報を固有表現とみなし抽出を試みた。提案手法は固有表現として抽出された企業名は、抽出部分の周囲にある形態素の情報を利用し、また略称等の表記ゆれを自動生成した企業名辞書とのマッチングを行った。それにより、ニューステキスト情報から企業名とされる情報を抽出し、抽出されたさまざまな企業名を同一企業として特定する。この方法により、企業名の抽出タスクの精度を改善した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。