2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[2G5-GS-6] 言語メディア処理:

2024年5月29日(水) 15:30 〜 17:10 G会場 (22+23会議室)

座長:牧田光晴(LINEヤフー株式会社/SB Intuitions株式会社)

15:50 〜 16:10

[2G5-GS-6-02] ChatGPTを用いたデータ拡張手法によるデータ不足時の大規模言語モデルの効率的評価

〇ZHU HANHUA1,2 (1. フリー株式会社、2. 東京大学)

キーワード:大規模言語モデル、データ拡張、評価モデル、ChatGPT

近年、GPT-3を始め、大規模言語モデル(LLM)の開発が急速に進展し、自然言語処理(NLP)の分野で重要な役割を果たしている。しかし、LLMは複雑な文書を出力することが多いため、効率的に評価するための統一的な基準がまだ確立されていない。また、学習済みの言語モデル(LM)を用いた評価方法はコストが低いため広く用いられているが、学習データが不足すると精度が十分に得られない問題がある。本研究では、データが不足している場合のLMの精度問題を解決するため、ChatGPTを用いたデータ拡張手法を提案する。日本語の質問応答(QA)タスクにおいて実験を行った結果、文書のみが存在する場合、提案手法により生成した質問と答えを学習データとして用いたLMは、ChatGPT3.5を上回り、ChatGPT4の92%の評価精度を達成することができた。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード