2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[2B4-GS-6] 言語メディア処理:言語モデル

2022年6月15日(水) 13:20 〜 15:00 B会場 (Room C-1)

座長:谷中 瞳(東京大学)[現地]

14:00 〜 14:20

[2B4-GS-6-03] 時間的常識理解へ向けた言語モデル構築への取り組み

〇木村 麻友子1、Kanashiro Pereira Lis1、浅原 正幸2、Cheng Fei 3、越智 綾子2、小林 一郎1 (1. お茶の水女子大学、2. 国立国語研究所、3. 京都大学)

キーワード:時間常識、汎用言語モデル、マスク言語モデル、多段ファインチューニング

文章中に表現される時間に関するイベントに対して,常識的な時間関係を捉えることができるようにすることは,自然言語理解においてとても重要な課題である.一方で,近年,幅広い自然言語処理(NLP)タスクで大きな成果を上げているBERTなどの事前学習済み言語モデルは,時間推論においてはまだ性能が低いと言われている.そこで,本研究では,時間的常識推論に対する言語モデルの開発に焦点を当て,複数のコーパスを用いたマルチステップのファインチューニングや,ファインチューニングの前に,時間的常識を問う対象のデータセットを用いて別のタスク(Masked Language Modeling)に基づく実験を行なった.実験の結果,時間的常識推論において,標準的なファインチューニングよりも大幅に精度が向上することが確認できた.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード