2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-18 デジタル人文学とAI

[1N4-OS-18] デジタル人文学とAI

2024年5月28日(火) 15:00 〜 16:40 N会場 (54会議室)

オーガナイザ:大向 一輝(東京大学)、嘉村 哲郎(東京藝術大学)、亀田 尭宙(国立歴史民俗博物館)、中村 覚(東京大学)

15:40 〜 16:00

[1N4-OS-18-03] 『源氏物語』の引き歌をベクトル検索によって検出する方法

〇近藤 泰弘1 (1. 青山学院大学)

キーワード:源氏物語、古今和歌集、引き歌、文埋め込み、ベクトル検索

『源氏物語』には、「引き歌」といって、会話などの文脈中に、表面的にはそれとはわからない形で、『古今集』などの一部を引用し、その意味を暗示的に付加して意味を豊富にする方法がある。古来から「引き歌」の研究は盛んであるが、作品中のどの部分が「引き歌」であるかは完全にはわかっていない。発表者は、以前に、文字N-gramを用いて、『源氏物語』と『古今和歌集』との比較を行うことで引き歌を研究したが、必ずしも十分な性能を得られなかった。今回は、『古今集』と『源氏物語』のセンテンスをすべて文埋め込みベクトルに変換して、ベクトル検索をすることにより、歌とフレーズとの類似を検出する方法を用いた。また、さらにN-gramの文字列一致の方法を加味することで、引き歌検出を高速に行うことができた。埋め込みベクトル作成については、OpenAIの提供するtext-embedding-ada-002を用いた。これにより、従来発表していたN-gramだけを用いる方法よりもはるかに高精度の引き歌検出を実現した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード