10:20 〜 10:40
[2O1-J-13-05] 有価証券報告書からの未来志向文の抽出
キーワード:ファイナンス、情報抽出、テキストマイニング
有価証券報告書には,企業の業績やリスク対策,施策等の様々な情報が記載されている.先行研究では,投資判断に有益な情報として,過去に起きた出来事(結果)とその理由(原因)を含む「因果関係文」を有価証券報告書等のテキスト情報から自動で抽出するモデルが提案されている.しかしながら,過去の情報以外に,将来における取り組みなどその企業に関する未来の情報についても,投資家の判断材料として有益であると考えられる.そこで本稿では,未来における内容を記述していること,企業の目的や取り組みついて記述していることという2つの特性に着目し,これら両方の特性を同時に保持している文を「未来志向文」と定義し,2つの機械学習モデルを組み合わせることでその自動抽出を試みた.その結果,本研究で構築したモデルが高い抽出能力を持つことが分かった.本モデルを用いることで未来における企業活動に関する情報が効率的に抽出でき,これまでにない投資判断基準の構築などが期待できるだろう.