2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[3J4-GS-6c] 言語メディア処理:言語モデル

2021年6月10日(木) 15:20 〜 17:00 J会場 (GS会場 5)

座長:人見 雄太(Insight Edge)

15:40 〜 16:00

[3J4-GS-6c-02] BERTによる引用要否判定とエラー分析

〇堂坂 浩二1、成松 宏美2、小山 康平3、東中 竜一郎 2、南 泰浩3、田盛 大悟4、平 博順4 (1. 秋田県立大学、2. NTTコミュニケーション科学基礎研究所、3. 電気通信大学、4. 大阪工業大学)

キーワード:論文執筆支援、引用可否判定、言語モデル

学術論文の爆発的増加と論文執筆において適切な文献を引用する必要性から論文執筆支援の研究が進められている.本発表では,論文執筆支援の中でも,論文の個々の文に引用を付与する必要があるかどうかという引用要否判定タスクに焦点をあて,大規模汎用言語モデルBERTの転移学習による判定モデルの結果とエラー分析について示す.まず,既存のCite-Worthy データセットを用い,BERTによる判定モデルの評価を行った.訓練データに正例77,000文,負例28万文,テストデータに正例8,500文,負例11万文を用い,判定モデルを学習した.畳み込みニューラルネットワークによる従来法(F値:0.43)に対し,大幅な性能向上(F値: 0.70)を得た.次に,Citation Functionデータセットを用い,引用意図ごとに判定モデルの評価を行った.評価の結果,「背景説明」といった多様な表現により表される引用意図のほうが,「従来との比較」といった表層が限定される引用意図よりも識別性能が低い傾向が見られた.エラー分析を通して,引用箇所の前後の文脈を含めたモデルの必要性について考察する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード