13:20 〜 13:40
[1E3-GS-6-02] 時系列に並んだ金融文書からの差分抽出タスクの提案
キーワード:テキストマイニング、差分抽出、金融文書
投資や企業分析において,伝統的に用いられてきた財務情報や経済指標などのデータに対して,今まで利活用の少なかったテキストデータの利用が進んでいる.金融ドメインにおける自然言語処理の研究では,ある一時点の文書の分析や評価が多く,時系列にわたる分析は一時点の評価を並べたものが主になっている.決算短信や有価証券報告書など,金融ドメインでは定期的に様々な文書が発行・公開されている.投資家を始めとしたこれらの文書の読者は,企業について継続的に注目し,同じ企業の文書について前回発行時からの変化に着目することが多い.多くの銘柄を運用する投資家にとって,それぞれの企業について二時点に存在する文書を隅々まで読み込み,変化した点を見つけることは容易ではない.本研究では,時系列に並ぶ2つの文書に対し,前回発行時の文書との差分や変化を抽出するタスクを提案する.具体的には,同じ企業について書かれた2つの金融文書を用い,同じ項目について書かれた箇所を抽出する.抽出した箇所について,人手によって2文書間の差分を抽出する.また提案したタスクに対し,事前学習言語モデルを実際に適用した評価実験を行う.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。