2021年度 人工知能学会全国大会(第35回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-3 ニュースメディアのデータサイエンス

[1D4-OS-3c] ニュースメディアのデータサイエンス(3/3)

2021年6月8日(火) 17:20 〜 18:20 D会場 (OS会場 2)

座長:高野 雅典(サイバーエージェント)

17:40 〜 18:00

[1D4-OS-3c-02] BertSumを用いた日本語ニュース記事の抽象型要約手法の検討

〇石原 慧人1、石原 祥太郎2、白井 穂乃2 (1. 筑波大学、2. 株式会社日本経済新聞社)

キーワード:自然言語処理、抽象型要約、BERT

本研究では,近年の自然言語処理領域で一般的になっている汎用的な事前学習モデル「BERT」を用いて,日本語ニュース記事の抽象型要約に取り組む.具体的には,3種類のBERTを用いて、BERTを拡張した要約手法「BertSum」のモデルを構築した。実験を通じて、多言語モデルよりも日本語モデルの方が優れた性能を発揮すると分かった。事前学習のコーパスとして日本語のニュース記事を用いたモデルと日本語のWikipediaを用いたモデルでは、性能に有意な差は確認できなかった。日本語のニュース記事を扱う上で重要なトークナイザーや未知語についても議論した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード