[4Rin1-27] 機械学習を用いた経済ニュースからのイベント抽出の省力化
キーワード:金融、ニュース解析
市場取引等のために経済ニュースを分析する際,株価変動に影響があるイベントを抽出することは重要である。人が考えたルールでイベントを抽出する場合,ルールが増えるにつれて管理が難しくなるという課題がある。ルールの作成・修正・管理する能力は個人に依るところも大きく,継続的に品質を確保していくことも課題となる。本論文ではこれらの課題を解決するため, 実務に耐えうる機械学習を用いたイベント抽出手法を提案する。
ベースとなる自然言語処理モデルとしては ALBERT を採用した。文章のトークン化には未知語や入力トークン数の制限に起因した情報損失を減らすため,サブワード化の手法である BPE-dropout を採用した。ドメイン知識を本モデルに獲得させるため,分析対象と同じQuick社が提供するニュースを用いて事前学習をおこなった。効果的な事前学習およびファインチューニングを行うため,イベント判定に不要な定型文を削除し,考えらえるニュースとイベントの組み合わせを学習データに追加した。本モデルのイベント抽出精度はF値で0.95を超え,実務に十分に耐えうることを確認した。
ベースとなる自然言語処理モデルとしては ALBERT を採用した。文章のトークン化には未知語や入力トークン数の制限に起因した情報損失を減らすため,サブワード化の手法である BPE-dropout を採用した。ドメイン知識を本モデルに獲得させるため,分析対象と同じQuick社が提供するニュースを用いて事前学習をおこなった。効果的な事前学習およびファインチューニングを行うため,イベント判定に不要な定型文を削除し,考えらえるニュースとイベントの組み合わせを学習データに追加した。本モデルのイベント抽出精度はF値で0.95を超え,実務に十分に耐えうることを確認した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。