2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[4J3-GS-6f] 言語メディア処理:データセットとその利用

2021年6月11日(金) 13:40 〜 15:20 J会場 (GS会場 5)

座長:亀甲 博貴(京都大学)

14:00 〜 14:20

[4J3-GS-6f-02] JSICK: 日本語構成的推論・類似度データセットの構築

〇谷中 瞳1、峯島 宏次2 (1. 理化学研究所、2. 慶應義塾大学)

キーワード:自然言語推論、含意関係認識、意味類似度、データセット、クラウドソーシング

単語と文の構造に基づいて新しい文を構成的に理解し,文間の意味的関係を認識することは,より人間らしい自然言語理解をコンピュータによって実現するための基本的な課題の一つである.本研究では,英語の構成的推論・類似度データセットSICKを人手で日本語に翻訳することで日本語の含意関係認識・文間類似度データセットJSICKを構築し,JSICKを学習した汎用言語モデルBERTが否定表現や量化表現といった多様な意味現象を構成的に捉えられているかについて,意味現象のタイプごとに評価を行う.さらに,語順を変えても意味内容が変わらないという日本語独自の性質を考慮して,モデルが意味現象を構成的に捉えているかについて分析を行う.実験の結果,現行の汎用言語モデルは数量表現や語順の入れ替えの扱いにおいて,改善の余地があることが示唆された.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード