2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-3 大規模言語モデルとデータサイエンス

[1E4-OS-3a] 大規模言語モデルとデータサイエンス

2025年5月27日(火) 15:40 〜 17:20 E会場 (会議室1101-2)

オーガナイザ:砂山 渡(滋賀県立大学),森 辰則(横浜国立大学),高間 康史(東京都立大学),西原 陽子(立命館大学)

16:20 〜 16:40

[1E4-OS-3a-03] 大規模言語モデルを用いて生成したペアワイズ比較データに基づくゼロショット小論文自動採点

〇柴田 拓海1、宮村 祐一1 (1. 有限責任監査法人トーマツ)

キーワード:小論文自動採点、大規模言語モデル、教育測定、ペアワイズ比較

近年,小論文試験の採点コストの削減を目指すアプローチの一つとして,大規模言語モデル(LLM)を用いたゼロショット小論文自動採点手法が注目されている.しかし従来のゼロショット自動採点手法はLLMに得点を直接生成させる方法に基づいており,LLMと人間の評価基準の違いやLLMが持つバイアスによる影響を強く受けるため,採点結果が人間と一致しないことが多い.このような問題を解決するために,本研究では,直接得点を生成する方法よりも人間の評価結果と一致する可能性が高いペアワイズ比較に基づく自動採点手法を提案する.具体的には,LLMを用いて異なる二つの小論文のうちどちらが高得点かを判定するペアワイズ比較データを生成し,生成されたデータを用いてBradley-Terryモデルを基礎とする深層学習自動採点モデルを訓練する.本研究では自動採点研究で一般に利用されるペンチマークデータセットを用いて得点予測精度の評価実験を行い,提案手法の有効性を評価する.実験により,提案手法は従来のゼロショット自動採点手法よりも高い得点予測性能を達成することを確認した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード