2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-10 AI応用

[3M1-GS-10] AI応用:テキスト・行動データの解析・生成

2023年6月8日(木) 09:00 〜 10:40 M会場 (会議室 D1)

座長:加藤 祥太(京都大学) [現地]

09:20 〜 09:40

[3M1-GS-10-02] 対照学習済みBERTによる不祥事記事分類と文章埋め込み表現の考察

〇高須 悠一朗1、小澤 誠一1、廣瀬 勇秀2、池田 佳弘2、中川 憲保2、飯塚 正昭2、西田 大輔2 (1. 神戸大学、2. 三井住友DSアセットマネジメント株式会社)

キーワード:深層学習、文書解析、不祥事記事分類

本研究では、経済記事が不祥事を取り上げたものかどうかを判定することを目的とし、2値分類問題に帰着した取り組みを報告する。不祥事は企業や組織の経営に甚大な影響を与えうるため、報道された記事をできるだけ早く検知し、その見落しは絶対に許されない。このことから、高い再現率が求められる。本研究では、SimCSEと呼ばれるBERTの文章空間の異方性を整えた深層学習モデルを用い、不祥事記事の見落としを抑えて、再現率の向上を試みた。ロイター記事を使った実験の結果、SimCSEを適用したBERTは、適用していないものと比べて再現率が向上した。文章空間のUniformityという指標においても向上が見られ、この等方的な空間が再現率の向上に寄与したと考えられる。また、ファインチューニング前後においても、Uniformityの高さは引き継がれることがわかった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード