2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-10 AI応用

[3K4-GS-10] AI応用:テキスト分析

2022年6月16日(木) 15:30 〜 16:50 K会場 (Room K)

座長:林 勝悟(NEC)[現地]

15:30 〜 15:50

[3K4-GS-10-01] 統合報告書からのESG関連情報の自動抽出

〇児玉 実優1、酒井 浩之1、永並 健吾1、高野 海斗2、中川 慧2 (1. 成蹊大学、2. 野村アセットマネジメント株式会社)

キーワード:ESG、統合報告書、情報抽出、テキストマイニング

近年, 投資家は, ESG(E:環境,S:社会,G:統治)情報を投資判断において重視しており,ESG関連情報をテキストデータから抽出する技術が必要とされている.
 ESG関連情報は統合報告書に多く記載がある. しかし, 企業によってレイアウトや内容が異なり, 学習データの作成が困難である. そこで本研究では, まず有価証券報告書(有報)から ESG関連情報を抽出する. 有報にも統合報告書ほどではないが, ESG 関連情報の記述がある. また, レイアウトはどの企業も同じであり, さらに XBRL 形式と呼ばれるテキスト形式で配布されているので, テキスト処理を行いやすい. 次に有報から抽出したESG関連情報を学習データとして,BERTモデルをファインチューニングする. 最後に当該BERTモデルを用いて統合報告書からESG関連情報を抽出することで,統合報告書から直接学習データを作成する困難を解決できた.
 実際に, 本手法で各企業の統合報告書から ESG 関連情報を抽出した.結果, E,S,Gに関する情報をそれぞれ93.3%,91.7%,77.4%の適合率で取得でき,良好な結果が得られた.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード