2020年度 人工知能学会全国大会(第34回)

講演情報

一般セッション

一般セッション » J-9 自然言語処理・情報検索

[3Q5-GS-9] 自然言語処理・情報検索: 意味類似性

2020年6月11日(木) 15:40 〜 17:00 Q会場 (jsai2020online-17)

座長:秋元康佑(NEC)

16:20 〜 16:40

[3Q5-GS-9-03] 単語埋め込みのノルムと方向ベクトルを区別した文間最適輸送コスト

〇横井 祥1,2、高橋 諒1,2、赤間 怜奈1,2、鈴木 潤1,2、乾 健太郎1,2 (1. 東北大学、2. 理化学研究所)

キーワード:自然言語処理、最適輸送

ふたつの自然言語文の意味的類似性が計算機によって精緻に計算できるようになれば,多くの自然言語処理アプリケーションの性能向上が期待できる.本稿では単語ベクトルのアラインメントに基づく新しい類似性尺度を提案する.
まず,単語ベクトルとノルム(大きさ)と方向ベクトル(向き)には,単語の重要度と意味がそれぞれ暗黙的にエンコードされていることを示す.さらに,単語ベクトルのアラインメントに基づく既存の文類似性尺度(Word Movers' Distance,DynaMax,BERTScore)は,いずれもノルムと方向ベクトルを“混ぜて”利用してしまっていることを指摘する.提案法は,単語ベクトルを単位超球面に射影し超球面上で最適輸送コストを計算する.これによりノルムは重要度の計算に,方向ベクトルは単語の意味的類似性の計算にのみ用いることができるようになる.最適輸送を用いる副次的効果として文の構造情報も考慮できるようになる.
実験では,現在最も盛んに取り組まれている文類似度計算のベンチマークテストであるSTS-Benchmarkを含む複数のデータセットで提案法が過去最高の性能を達成することを示す.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード