09:00 〜 10:40
[3Pin1-27] コーパスとシソーラスを用いた比喩生成
キーワード:自然言語処理、比喩
本研究の目的はコーパスとシソーラスを用いてユーザが指定した被喩辞と特徴語の組に対応する比喩を生成し、提案するシステムを構築することである。本研究では、2つのプロセスから喩辞を求める。1つめはword2vecを用いて被喩辞と特徴語の単語ベクトルを取得し、コサイン類似度を基に喩辞の選択に用いる。word2vecを用いることで任意のコーパスから単語ベクトルを作成することができ、ユーザの執筆する文章に合わせたことば選びが可能である。2つめは分類語彙表のカテゴリを用いて特徴語とカテゴリの共起行列を作成し、特徴語と共起しやすいカテゴリに属する単語を喩辞とする。共起行列により特徴語に適した多様な喩辞を提案できる。システムが生成した喩辞を適切性と有用性の観点から評価した。結果として、適切な比喩の割合は低いもののユーザが文章を作成するに当たって有用な比喩を生成することができた。次に、青空文庫をコーパスとした単語ベクトルを用いた場合の喩辞と国語研日本語ウェブコーパスの単語ベクトルを用いた場合の喩辞を比較した。その結果コーパスを変えることでユーザの執筆する文章に合わせた喩辞が出力できることが分かった。