[2Win5-39] 推論過程の探索に基づく大規模言語モデルによる自動評価への取り組み
キーワード:大規模言語モデル、自動評価
近年,大規模言語モデルによる生成文の評価に大規模言語モデルを用いる自動評価が,人手の評価コスト削減,従来の統計的な指標よりも内容を捉えた評価が可能である点で注目されている. 本研究では,人と近い評価を出せる自動評価手法の構築を目的として二段階の学習を行う.一段階目では評価理由の生成と理由に基づいた推論の両方を可能にする.二段階目では強化学習を用いて人と近い評価をした場合の評価理由を良い推論過程とし,人のものとそぐわない評価をした場合の評価理由は良くない推論過程としてモデルを学習させる.実験設定の範囲において理由に基づく評価モデルの有効性が示唆された一方,強化学習はさらなる実験が必要となった.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。