JSAI2025

Presentation information

Organized Session

Organized Session » OS-34

[1L3-OS-34] OS-34

Tue. May 27, 2025 1:40 PM - 3:20 PM Room L (Room 1007)

オーガナイザ:林 祐輔(AIアライメントネットワーク),坂本 航太郎(東京大学),和地 瞭良(LINEヤフー),阿部 拳之(サイバーエージェント),森村 哲郎(サイバーエージェント)

1:40 PM - 2:00 PM

[1L3-OS-34-01] Aligning Japanese Large Language Models through Self-Improvement: An Empirical Study

〇Mitsuki Sakamoto1, Yu Jinnai1, Tetsuro Morimura1, Kenshi Abe1, Kaito Ariu1 (1. CyberAgent)

Keywords:LLM, Alignment, RLHF, Reinforcement Learning, Self-Improving

大規模言語モデル (LLM) のアライメントは,モデルの出力を人間の選好に適合させるために不可欠である.しかし,高品質な選好データの収集は高コストで,LLMによるデータ合成が注目されている.既存研究の多くは英語中心で,非英語少データに対する合成手法はは明らかにされていない.本研究では,日本語のAnswer Carefullyデータセットを用い,自己学習 (self-improving learning) に基づく選好データの合成手法を比較した.実験の結果,CALM3を用いた自己合成手法は,報酬モデルを用いた合成手法と同等のアライメント効果を達成し,日本語少データ環境における有効性が示された.

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password