[4Xin2-29] 大規模言語モデルによる数学的推論の多言語比較
キーワード:大規模言語モデル、数学、多言語比較
大規模言語モデル(LLM)の数学的推論能力は,自然言語のみでは高い性能を発揮しないが,コード生成や外部ツールを統合することで大幅に向上する.自然言語のみで数学的推論能力を強化すれば,全体的なパフォーマンスが向上することが期待されるが,そのための方法はまだ確立されていない.LLMは主に英語を対象としているが,他の言語でも活用することでタスクのパフォーマンスが向上する例が確認されており,数学的推論能力に関しても改善の可能性が示唆されるが,まだ明らかになっていない.本研究は,言語がLLMの数学的推論能力に与える影響を明らかにすることを目的して,代表的なLLMであるGPTを利用し,5つの異なる言語で数学的課題における精度を比較した.英語以外の言語で実施されたいくつかの課題は,英語よりも精度が高いことが明らかになった.本研究は,LLM の数学的推論能力と多言語能力に関する新しい知見を提供できることが期待される.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。