2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[3T1-GS-6] 言語メディア処理

2023年6月8日(木) 09:00 〜 10:40 T会場 (遠隔)

座長:梶原 智之(愛媛大学) [現地]

09:20 〜 09:40

[3T1-GS-6-02] 日本語におけるChain-of-Thoughtプロンプトの検証

〇堀尾 海斗1、村田 栄樹1、王 昊1、井手 竜也1、河原 大輔1、山﨑 天2、新里 顕大2、中町 礼文2、李 聖哲2、佐藤 敏紀2 (1. 早稲田大学、2. LINE株式会社)

[[オンライン]]

キーワード:自然言語処理

大規模基盤モデルは,少数の例をプロンプトとして入力に与えるFew-Shot学習によって様々なタスクに対応できる.Few-Shot学習の精度をさらに向上させるための手法として,思考の過程をステップに分けて与えるChain-of-Thought (CoT)プロンプトが提案されている.CoTの有効性は,論理的な推論を必要とするタスクに関する英語のデータセットで示されているが,日本語では検証されていない.本研究では日本語の基盤モデルであるHyperCLOVAを用いて,CoTの日本語における有効性を検証する.まず,算数,常識推論,記号推論の3つのタスクにおいて日本語データセットを構築する.次に,4種類のモデルサイズのHyperCLOVAを用いた検証実験を行った結果,CoTプロンプトは通常のプロンプトより精度が高く,またCoTプロンプトの性能はモデルサイズと相関があることが明らかになった.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード