2025年度 人工知能学会全国大会(第39回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[3Win5] ポスターセッション3

2025年5月29日(木) 15:30 〜 17:30 W会場 (イベントホールD-E)

[3Win5-12] JUBAKU: 日本文化における偏見評価のための敵対的ベンチマーク

〇塩谷 泰平1、金子 正弘2,1、丹羽 彩奈2、丸山 裕生1、大葉 大輔1、大井 聖也1、岡崎 直観1,3,4 (1.東京科学大学、2.MBZUAI、3.産業技術総合研究所、4.国立情報学研究所 大規模言語モデル研究開発センター)

キーワード:自然言語処理、大規模言語モデル、公平性

大規模言語モデル(LLM)に対する偏見評価において,非英語圏では英語データセットの翻訳に依存している現状がある.しかし,このような翻訳されたデータセットは西洋文化を基盤としており,異なる文化圏における倫理観や社会規範を十分に反映していない.本研究では,日本文化に対応した敵対的偏見評価ベンチマーク「JUBAKU」を構築し,LLMの偏見を誘発する対話データを人手で作成した.JUBAKUを用いて9種類の日本語LLMを評価した結果,全モデルがランダムベースラインを下回り,日本文化特有の偏見に対する脆弱性が明らかになった.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード