15:40 〜 16:00
[1N4-OS-18-03] 『源氏物語』の引き歌をベクトル検索によって検出する方法
キーワード:源氏物語、古今和歌集、引き歌、文埋め込み、ベクトル検索
『源氏物語』には、「引き歌」といって、会話などの文脈中に、表面的にはそれとはわからない形で、『古今集』などの一部を引用し、その意味を暗示的に付加して意味を豊富にする方法がある。古来から「引き歌」の研究は盛んであるが、作品中のどの部分が「引き歌」であるかは完全にはわかっていない。発表者は、以前に、文字N-gramを用いて、『源氏物語』と『古今和歌集』との比較を行うことで引き歌を研究したが、必ずしも十分な性能を得られなかった。今回は、『古今集』と『源氏物語』のセンテンスをすべて文埋め込みベクトルに変換して、ベクトル検索をすることにより、歌とフレーズとの類似を検出する方法を用いた。また、さらにN-gramの文字列一致の方法を加味することで、引き歌検出を高速に行うことができた。埋め込みベクトル作成については、OpenAIの提供するtext-embedding-ada-002を用いた。これにより、従来発表していたN-gramだけを用いる方法よりもはるかに高精度の引き歌検出を実現した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。