Weights & Biasesを使ったモデル評価の最前線〜日本最大のLLMリーダーボードの開発・運営経験を踏まえて〜

シバタ アキラ

13:00 〜 13:50

[3C3-LS-9-01] Weights & Biasesを使ったモデル評価の最前線〜日本最大のLLMリーダーボードの開発・運営経験を踏まえて〜

シバタアキラ¹、山本祐也¹、鎌田啓輔¹ (1. Weights & Biases)

Weights & Biasesが提供するNejumi LLMリーダーボードは大規模言語モデルの日本語評価のゴールドスタンダードに成長しました。またW&Bは経産省のGPU支援プロジェクト（GENIAC）他様々な企業にも公式のモデル評価プラットフォームを提供しています。このランチセミナーでは、私たちのモデル評価の経験から最新のLLM評価方法と、そこから得られたインサイト、そしてW&Bユーザーの皆さんが簡単に評価を実行する方法をご紹介します。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[3C3-LS-9] ランチョンセミナー9（Weights & Biases）

[3C3-LS-9-01] Weights & Biasesを使ったモデル評価の最前線〜日本最大のLLMリーダーボードの開発・運営経験を踏まえて〜

パスワード