2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-3 知識の利用と共有

[3R1-GS-3] 知識の利用と共有

2023年6月8日(木) 09:00 〜 10:40 R会場 (602)

座長:森田 武史(青山学院大学) [現地]

10:00 〜 10:20

[3R1-GS-3-04] 日本語語義曖昧性解消のための前後段落を利用した単語分散表現の生成

〇前原 太陽1、竹中 要一1 (1. 関西大学)

キーワード:語義曖昧性、単語分散表現、BERT

近年、単語をベクトルで表す「分散表現」を利用することでコンピュータが言語の意味を扱いやすくなった。しかし、多義語については語義曖昧性解消という課題が残っている。語義曖昧性解消とは複数の語義をもつ多義語において、文中でどの語義として利用されているかを判別することであり、コンピュータが言語の意味を扱うために重要なタスクである。本研究では、日本語の語義曖昧性解消を目的として、異なる語義のクラスタ間分散を大きくし、クラスタ内では分散が小さくなるように単語の分散表現を生成する方法を提案する。提案するモデルは分散表現の生成時に、従来の入力に加え、分散表現を作成したい多義語を含む段落の前後の段落を入力するモデルである。語義曖昧性解消の対象とした単語の分散表現を従来の手法と提案手法によって生成し、語義数を岩波国語辞典に掲載されている語義数でクラスタ数を指定した階層型クラスタリングを行った。2つの分散表現のクラスタ間分散とクラスタ内の値を比較したところ、提案手法による分散表現の方が優れた値を示した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード