クラウドソーシングによる単調推論データセットの構築

谷中 瞳

13:40 〜 14:00

[2L3-J-9-02] クラウドソーシングによる単調推論データセットの構築

谷中瞳^1,2、〇戸次大介²、峯島宏次²、関根聡¹、乾健太郎^3,1 (1. 理化学研究所AIPセンター、2. お茶の水女子大学、3. 東北大学)

キーワード：自然言語理解、含意関係認識、データセット構築、クラウドソーシング

近年、クラウドソーシングを活用して大規模な言語資源を低コストで構築できるようになった。含意関係認識の研究においても例外ではなく、クラウドソーシングによって構築したデータセットから、ニューラルネットワークを用いて文の意味を学習し、含意関係認識問題を解く手法が活発に研究されている。しかし、クラウドソーシングによって論理的推論を扱う問題を設計することは容易ではなく、既存のデータセットにはそのような問題が含まれていないため、ニューラル含意関係認識モデルが文の論理的な意味を学習できているのかは自明ではない。そこで本研究では、形式意味論の知見とクラウドソーシングの手法を組み合わせて、単調推論のデータセットを構築する手法を提案する。また、現時点でのデータセット構築結果についても報告する。データを分析した結果、論理的に妥当な推論と、語用論的に人間が正しいと判断する推論との間にギャップがあるケースが観察された。

講演情報

[2L3-J-9] 自然言語処理・情報検索: 知識の生成と提供

[2L3-J-9-02] クラウドソーシングによる単調推論データセットの構築