13:00 〜 13:50
[3C3-LS-9-01] Weights & Biasesを使ったモデル評価の最前線〜日本最大のLLMリーダーボードの開発・運営経験を踏まえて〜
Weights & Biasesが提供するNejumi LLMリーダーボードは大規模言語モデルの日本語評価のゴールドスタンダードに成長しました。またW&Bは経産省のGPU支援プロジェクト(GENIAC)他様々な企業にも公式のモデル評価プラットフォームを提供しています。このランチセミナーでは、私たちのモデル評価の経験から最新のLLM評価方法と、そこから得られたインサイト、そしてW&Bユーザーの皆さんが簡単に評価を実行する方法をご紹介します。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。