16:30 〜 16:50
[2I5-GS-10-04] コスト削減手法を取り入れたRAGによる質問応答システムの提案
キーワード:検索拡張生成、ChatGPT
Retrieval-Augmented Generation (RAG) は,外部の情報を大規模言語モデルと結びつけることで,組織内のドキュメントなどに対応した質問応答を可能とする技術である. 近年は,ChatGPTとRAGを組み合わせた質問応答サービスも普及しつつある. 一方で,GPT-4などの高性能なモデルを大規模な環境で利用する場合,入力トークンの増加によって,APIのコストが高くなる傾向にある. 本研究では,回答生成の前にGPT-3.5などの低コストなモデルを用いて,ドキュメントから必要な情報のみを選択する追加ステップを導入することを提案する. これにより,回答生成時に利用するトークン数が減少し,GPT-4における利用コストを抑えることが可能となる. また,提案手法を用いた結果と従来手法の結果を比較し,その効果を検証した. 結果として,提案手法が精度を保ちつつ,コストを抑えることを確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。