14:40 〜 15:00
[4J3-GS-6f-04] 子供向け日本語換言コーパス構築のための文間類似度計算法の評価
キーワード:日本語コーパス、言い換え、文間類似度
近年,新聞を教材として活用する取り組みであるNIE(Newspaper in Education)が小学校を中心に実践されている.しかし,一般の新聞記事は,小学生にとって理解が難しいため,自動でニュース記事を平易に言い換えることができれば,問題を改善できる.しかし,日本語においては,子供向けの言い換えに活用できるコーパスは,十分整備されているとはいえない.そこで本研究では,NHKが提供する子ども向けニュース提供サービス「NEWS WEB EASY(NWE)」に注目する.NWEでは,一般向けに書かれたWebニュース記事の一部を子どもに適した記事に修正して公開している.NWEの記事と一般向けのニュース記事を,それぞれ平易文と難解文とみなして対応づけることで,換言コーパスの構築を目指す.本稿では,NWEの記事群と一般向けのニュース記事群を用いて,英語の文間類似度計算手法の日本語における有効性を検証する.評価実験の結果,単語の分散表現を用いた類似度計算手法において,単語の品詞制約による精度の向上を確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。