2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 9.自然言語処理・情報検索

[3G2] 自然言語処理-文書構造解析

2018年6月7日(木) 15:50 〜 17:30 G会場 (5F ルビーホール飛天)

座長:西田 京介(NTT)

17:10 〜 17:30

[3G2-05] 単語分散表現による語義の近似を用いた語彙平易化手法

高田 祥平1、〇荒瀬 由紀1、内田 諭2 (1. 大阪大学大学院情報科学研究科、2. 九州大学大学院言語文化研究院)

キーワード:語彙平易化、言語教育支援

英語の教育現場では,教育者は学習者のレベルに合わせた英文の難易度の調整を行っているが,調整には多くの時間と労力を要する.そこで本研究では,英語教育者の教材作成支援を目的とした語彙平易化手法を提案する.提案手法では,以下の3ステップで語彙平易化を実現する.まず,Common European Framework of Reference for Language (CEFR) に基づいて言い換えの対象となる難単語を特定する.次に類義語辞書を用いて言い換え候補となる平易な類義語を絞り込む.最後に各言い換え候補について,機械学習により言い換えの可否を判定する.
言い換え可能な候補は,元の単語が現れる文中の文脈において同一の意味を表現できなければならない.そこで,本研究では語義を近似する単語分散表現を生成し,特徴量として用いる.
評価実験の結果,提案手法は提示する候補リストの精度を高く保ったまま,より多くの対象に対して言い換え候補を提示できるという,教育支援において望ましい性質を持つことが明らかとなった.また言い換えの判定が難しい多義語についても,精度よく言い換え候補を提示できることが分かった.