2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[4J3-GS-6f] 言語メディア処理:データセットとその利用

2021年6月11日(金) 13:40 〜 15:20 J会場 (GS会場 5)

座長:亀甲 博貴(京都大学)

14:40 〜 15:00

[4J3-GS-6f-04] 子供向け日本語換言コーパス構築のための文間類似度計算法の評価

〇西山 朋貴1、安藤 一秋1 (1. 香川大学)

キーワード:日本語コーパス、言い換え、文間類似度

近年,新聞を教材として活用する取り組みであるNIE(Newspaper in Education)が小学校を中心に実践されている.しかし,一般の新聞記事は,小学生にとって理解が難しいため,自動でニュース記事を平易に言い換えることができれば,問題を改善できる.しかし,日本語においては,子供向けの言い換えに活用できるコーパスは,十分整備されているとはいえない.そこで本研究では,NHKが提供する子ども向けニュース提供サービス「NEWS WEB EASY(NWE)」に注目する.NWEでは,一般向けに書かれたWebニュース記事の一部を子どもに適した記事に修正して公開している.NWEの記事と一般向けのニュース記事を,それぞれ平易文と難解文とみなして対応づけることで,換言コーパスの構築を目指す.本稿では,NWEの記事群と一般向けのニュース記事群を用いて,英語の文間類似度計算手法の日本語における有効性を検証する.評価実験の結果,単語の分散表現を用いた類似度計算手法において,単語の品詞制約による精度の向上を確認した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード