1:00 PM - 1:50 PM
[3C3-LS-9-01] Other
Weights & Biasesが提供するNejumi LLMリーダーボードは大規模言語モデルの日本語評価のゴールドスタンダードに成長しました。またW&Bは経産省のGPU支援プロジェクト(GENIAC)他様々な企業にも公式のモデル評価プラットフォームを提供しています。このランチセミナーでは、私たちのモデル評価の経験から最新のLLM評価方法と、そこから得られたインサイト、そしてW&Bユーザーの皆さんが簡単に評価を実行する方法をご紹介します。
Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.