15:30 〜 15:50
[3K4-GS-10-01] 統合報告書からのESG関連情報の自動抽出
キーワード:ESG、統合報告書、情報抽出、テキストマイニング
近年, 投資家は, ESG(E:環境,S:社会,G:統治)情報を投資判断において重視しており,ESG関連情報をテキストデータから抽出する技術が必要とされている.
ESG関連情報は統合報告書に多く記載がある. しかし, 企業によってレイアウトや内容が異なり, 学習データの作成が困難である. そこで本研究では, まず有価証券報告書(有報)から ESG関連情報を抽出する. 有報にも統合報告書ほどではないが, ESG 関連情報の記述がある. また, レイアウトはどの企業も同じであり, さらに XBRL 形式と呼ばれるテキスト形式で配布されているので, テキスト処理を行いやすい. 次に有報から抽出したESG関連情報を学習データとして,BERTモデルをファインチューニングする. 最後に当該BERTモデルを用いて統合報告書からESG関連情報を抽出することで,統合報告書から直接学習データを作成する困難を解決できた.
実際に, 本手法で各企業の統合報告書から ESG 関連情報を抽出した.結果, E,S,Gに関する情報をそれぞれ93.3%,91.7%,77.4%の適合率で取得でき,良好な結果が得られた.
ESG関連情報は統合報告書に多く記載がある. しかし, 企業によってレイアウトや内容が異なり, 学習データの作成が困難である. そこで本研究では, まず有価証券報告書(有報)から ESG関連情報を抽出する. 有報にも統合報告書ほどではないが, ESG 関連情報の記述がある. また, レイアウトはどの企業も同じであり, さらに XBRL 形式と呼ばれるテキスト形式で配布されているので, テキスト処理を行いやすい. 次に有報から抽出したESG関連情報を学習データとして,BERTモデルをファインチューニングする. 最後に当該BERTモデルを用いて統合報告書からESG関連情報を抽出することで,統合報告書から直接学習データを作成する困難を解決できた.
実際に, 本手法で各企業の統合報告書から ESG 関連情報を抽出した.結果, E,S,Gに関する情報をそれぞれ93.3%,91.7%,77.4%の適合率で取得でき,良好な結果が得られた.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。