2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[1K1-GS-6] 言語メディア処理:評価と分析

2022年6月14日(火) 10:00 〜 11:40 K会場 (Room K)

座長:大杉 康仁(NTT)[遠隔]

11:20 〜 11:40

[1K1-GS-6-05] 単語ベクトルの類似度を用いた英米文学の通時的含意分析

ハーマン・メルヴィルの作品群に見る数値化した含意の年代的変遷

〇金子 淳1、大槻 恭士2、坂口 隆之3 (1. 三重大学 教育学部、2. 山形大学 大学院 理工学研究科、3. 山形大学 地域教育文化学部)

[[オンライン]]

キーワード:自然言語処理、英米文学、Word2vec、fastText、spaCy

作家が作品の中で使っている言葉の意味やイメージは、私たちが普段使っている言葉のそれとは微妙に異なっている。その差異を明らかにすることは、作家固有の思想・世界観を解明するきっかけになる。この点につき、すでに「含意分析」として単語ベクトルの類似度を用いて数値化する試みを行なった。これを踏まえ、今回は、作家の同一の言葉でも、書かれた年代によって、あるいは作品によって、その含意が通時的にどのように変遷しているかを、文学研究者の直観や主観に依拠していた従来の方法ではなく、単語ベクトルの類似度によって数値化、分析し、明らかにした。具体的には、アメリカの作家ハーマン・メルヴィルの作品を複数取り上げた。Project Gutenbergで公開されているテキストを年代順にいくつか取り上げ、fastTextで単語ベクトルを生成、重要度の高い単語に焦点を絞り、それらの類似度と、fastTextが提供している英語の学習済みモデル(fastText (en))における同じ単語での類似度を比較し、総合的に解釈した。その結果、単語の含意が年代や作品毎に変遷していることが数値により明らかになった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード