2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-1 データセットとベンチマークの技術的・社会的な視点

[1P4-OS-1b] データセットとベンチマークの技術的・社会的な視点

2025年5月27日(火) 15:40 〜 17:20 P会場 (会議室801-2)

オーガナイザ:鈴木 健二(ソニーグループ),原 聡(電気通信大学),谷中 瞳(東京大学),菅原 朔(国立情報学研究所)

16:00 〜 16:20

[1P4-OS-1b-02] 圧縮による人材領域日本語データに対するLLM性能評価

〇佐藤 哲1、辻 菜々実1、洪 鵬1、上野 雅史1、奥村 裕之1 (1. パーソルキャリア株式会社)

キーワード:大規模言語モデル、圧縮

LLMの出力を利用したデータ圧縮において,LLMの性能と圧縮性能の関係性が研究されている.しかし,日本語データを使ってその関係性を検証した研究は少ない.そこで本研究では,日本語の特定ドメインの人材領域データを用いてLLMの性能と圧縮性能の関係を検証した.その結果として,圧縮率と複数のベンチマークから得られたスコアにほぼ線形の関係性があることが分かった.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード