2024年度 人工知能学会全国大会(第38回)

講演情報

ナイト/ランチョン

企業プログラム » ランチョン・ナイトセッション

[3C3-LS-9] ランチョンセミナー9(Weights & Biases)

2024年5月30日(木) 13:00 〜 13:50 C会場 (イベントホール仮設1)

13:00 〜 13:50

[3C3-LS-9-01] Weights & Biasesを使ったモデル評価の最前線〜日本最大のLLMリーダーボードの開発・運営経験を踏まえて〜

シバタ アキラ1、山本 祐也1、鎌田 啓輔1 (1. Weights & Biases)

Weights & Biasesが提供するNejumi LLMリーダーボードは大規模言語モデルの日本語評価のゴールドスタンダードに成長しました。またW&Bは経産省のGPU支援プロジェクト(GENIAC)他様々な企業にも公式のモデル評価プラットフォームを提供しています。このランチセミナーでは、私たちのモデル評価の経験から最新のLLM評価方法と、そこから得られたインサイト、そしてW&Bユーザーの皆さんが簡単に評価を実行する方法をご紹介します。

要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン