10:00 〜 10:20
[3R1-GS-3-04] 日本語語義曖昧性解消のための前後段落を利用した単語分散表現の生成
キーワード:語義曖昧性、単語分散表現、BERT
近年、単語をベクトルで表す「分散表現」を利用することでコンピュータが言語の意味を扱いやすくなった。しかし、多義語については語義曖昧性解消という課題が残っている。語義曖昧性解消とは複数の語義をもつ多義語において、文中でどの語義として利用されているかを判別することであり、コンピュータが言語の意味を扱うために重要なタスクである。本研究では、日本語の語義曖昧性解消を目的として、異なる語義のクラスタ間分散を大きくし、クラスタ内では分散が小さくなるように単語の分散表現を生成する方法を提案する。提案するモデルは分散表現の生成時に、従来の入力に加え、分散表現を作成したい多義語を含む段落の前後の段落を入力するモデルである。語義曖昧性解消の対象とした単語の分散表現を従来の手法と提案手法によって生成し、語義数を岩波国語辞典に掲載されている語義数でクラスタ数を指定した階層型クラスタリングを行った。2つの分散表現のクラスタ間分散とクラスタ内の値を比較したところ、提案手法による分散表現の方が優れた値を示した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。