多段階リランキングモデルによるテキスト検索

笹沢 裕一

14:40 〜 15:00

[4A3-GS-6-03] 多段階リランキングモデルによるテキスト検索

〇笹沢裕一¹、横手健一¹、今一修¹、十河泰弘¹ (1. 日立製作所研究開発グループ)

キーワード：テキスト検索、自然言語処理、事前学習済み言語モデル

テキスト検索は検索クエリに対して類似ドキュメントを検索するタスクであり，検索速度を一定に保ちながら検索精度を向上させることが重要である．テキスト検索手法の一つに、言語モデルを用いたリランキングモデルがある。しかし、精度を向上させるためにモデルのパラメータ数を増やしたり、モデルアンサンブルを利用したりすると、検索速度が遅延する。そこで検索の遅延を抑えつつ精度を向上させるために，高精度な言語モデルを用いた多段階テキスト検索モデルを提案する．BM25と言語モデルによって文書をランク付けし、クエリとの類似度が高い文書に対してモデルアンサンブルやより大規模な言語モデルによってリランキングを行う。実験では、MS-MARCOデータセットでMiniLM言語モデルを学習し、ゼロショット設定で評価する。提案手法は検索速度の減衰を抑えつつ、より高い検索精度を実現する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4A3-GS-6] 言語メディア処理

[4A3-GS-6-03] 多段階リランキングモデルによるテキスト検索

パスワード