15:00 〜 15:20
[4Q3-GS-9-04] 構文解析と表解析による金融開示文書からの情報抽出
キーワード:自然言語処理、情報抽出、金融
金融ドメインにおいて投資家は投資判断等を行うにあたり、株券や社債券の発行に伴って開示される文書から必要となる情報を読み取って、意思決定の材料としている。開示文書は、XBRL形式で公開されており、複数のテキストブロックおよび表から構成され、それらの中に自然言語の形で必要となる情報が散在している。開示文書から必要な情報のみを抽出してDB等で継続的に管理することが意思決定の材料として扱いやすく望ましいが、必要な項目だけでも約50から80項目にわたり、開示文書からそれらを人が読み取り、抽出するのは時間的コストが大きい。本発表では、この開示文書に対して自然言語処理技術を適用し、構文木の木構造に基づくパターンマッチと表解析によって必要情報を抽出した結果について報告する。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。