2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[4J3-GS-6f] 言語メディア処理:データセットとその利用

2021年6月11日(金) 13:40 〜 15:20 J会場 (GS会場 5)

座長:亀甲 博貴(京都大学)

14:20 〜 14:40

[4J3-GS-6f-03] ノウハウ読解用コンテキストデータセットの作成および評価

〇白 書霆1、李 廷軒1、鈴木 勢至1、宇津呂 武仁1、河田 容英2 (1. 筑波大学、2. ログワークス)

キーワード:質問応答、機械読解、ノウハウ、BERT、コンテキスト

TF-IDF法によるコンテキスト検索手法,および,ノウハウ機械読解タスク用に
fine-tuning済みのBERTを連結した大規模ノウハウ機械読解の手法を提案する.
そして,その実現のための,ノウハウ機械読解用コンテキストデータセットの作
成方法を提案する.先行研究により,インターネット上のノウハウサイトに掲載
されているコラムページは,ノウハウ質問回答事例の作成において有効な情報源
として使用できるという分析結果が報告された.この結果を踏まえ,先行研究で
は,ノウハウサイトを選定し,ノウハウサイトに掲載されているコラムページを
収集し,ノウハウ質問回答事例集を作成した.そこで,本論文では,先行研究に
おいて作成されたノウハウ質問回答事例に加えて,コラムページ上で未使用の段
落を収集し,これを用いて大規模ノウハウ読解タスクにおける検索用コンテキス
ト集合を作成する.そして,大規模ノウハウコンテキスト集合に対して,大規模
ノウハウ機械読解タスクを適用し,一定以上の性能のもとで,大規模ノウハウ読
解が行えることを示す.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード