2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 2.機械学習

[1N2] 機械学習-機械学習応用(2)

2018年6月5日(火) 15:20 〜 17:00 N会場 (2F 桜島)

座長:岡本 昌之(トヨタ自動車株式会社)

16:00 〜 16:20

[1N2-03] スタイルの類似性を捉えた単語ベクトルの教師なし学習

〇赤間 怜奈1、渡邉 研斗1、横井 祥1,2、小林 颯介3、乾 健太郎1,2 (1. 東北大学、2. 理研AIP、3. 株式会社Preferred Networks)

キーワード:自然言語処理、教師なし学習、スタイル多様性

本研究は,教師なし学習によりスタイル(言葉遣いや文体など)の類似性を捉えるを試みる初めての研究である.
本研究では「スタイル」の類似性を捉えるベクトル空間を構築するに当たり,「同一発話内に含まれる単語は同一のスタイルを持つ」という仮定を置く.
この仮定に基づき,同一発話内の単語を予測できるようなベクトルを構成することで,スタイルの類似性を捉えた単語ベクトル空間を獲得する手法を提案する.我々が期待する単語ベクトル空間とは,(「意味」は近くとも)「スタイル」が大きく異なる``俺''と``私''は遠くに配置され,(「意味」は異なっているとしても)「スタイル」が似ている``俺''と``だぜ''が近くに配置されるような空間である.
さらに本研究では,スタイルの類似性を包括的に定量評価する手法を提案し,そのための評価データセットを新たに作成する.
提案手法により獲得した単語ベクトルが,スタイルの類似性を捉えていることを定量的および定性的に示す.