2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-10 AI応用

[2I5-GS-10] AI応用:産業

2024年5月29日(水) 15:30 〜 17:10 I会場 (41会議室)

座長:堤 富士雄(電力中央研究所)

16:30 〜 16:50

[2I5-GS-10-04] コスト削減手法を取り入れたRAGによる質問応答システムの提案

〇増田 嶺1、岩本 和真1、道信 祐成1、北 健志2、竹原 一駿1、安藤 一秋1、亀井 仁志1、最所 圭三1、喜田 弘司1 (1. 香川大学、2. 株式会社STNet)

キーワード:検索拡張生成、ChatGPT

Retrieval-Augmented Generation (RAG) は,外部の情報を大規模言語モデルと結びつけることで,組織内のドキュメントなどに対応した質問応答を可能とする技術である. 近年は,ChatGPTとRAGを組み合わせた質問応答サービスも普及しつつある. 一方で,GPT-4などの高性能なモデルを大規模な環境で利用する場合,入力トークンの増加によって,APIのコストが高くなる傾向にある. 本研究では,回答生成の前にGPT-3.5などの低コストなモデルを用いて,ドキュメントから必要な情報のみを選択する追加ステップを導入することを提案する. これにより,回答生成時に利用するトークン数が減少し,GPT-4における利用コストを抑えることが可能となる. また,提案手法を用いた結果と従来手法の結果を比較し,その効果を検証した. 結果として,提案手法が精度を保ちつつ,コストを抑えることを確認した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード