JSAI2018

Presentation information

Oral presentation

General Session » [General Session] 9. NLP / IR

[2L4] [General Session] 9. NLP / IR

Wed. Jun 6, 2018 5:20 PM - 7:00 PM Room L (3F Sapphire Hall Asuka)

座長:角森 唯子(NTTドコモ)

5:20 PM - 5:40 PM

[2L4-01] Measuring Beginner Friendliness of Web Pages explaining Academic Concepts by Integrating Heterogeneous Features

〇Shiokawa Hayato1, Takahide Kasuga1, Kota Kawaguchi1, Bingcai Han1, Takehito Utsuro1, Yasuhide Kawada2 (1. University of Tsukuba, 2. Logworks Co., Ltd.)

Keywords:Web Pages explaining Academic Concepts, HTML Analysis, Deep Learning

インターネットで学術用語を学ぶ際,ウェブ検索に頼れば関連ページは容易に見つかる.しかし,「分かり易い用語解説」を見つけるには,検索上位ページを一つずつ見比べ読み進める非効率な作業が必要となる.本論文では,学術用語の検索上位ページの中で分かり易さを充足する必要十分な数の用語解説ページを見つけ体系化することを目的とする.特に,6個の個別因子のうち「レイアウトの見易さ」についての因子を対象とし,深層学習を用いてこの因子を自動評定する方式によって得られる特徴量,および,用語解説ウェブページのHTMLソーステキスト中のテキスト情報の特徴量を併用して,分類器としてSVMを用いて全体評定の自動判定を行う手法を適用し,異種の特徴量を効果的に併用可能であることを示す.特に,理工系学術用語を検索クエリとして収集した用語解説ウェブページを対象として行った評価結果をふまえて,提案手法の有効性を示す.

発表希望日・・・順位1:6月5日(火)午後、順位2:6月5日(火)午前、順位3:6月6日(水)午前、順位4:6月6日(水)午後