2025年度 人工知能学会全国大会(第39回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[1Win4] ポスターセッション1

2025年5月27日(火) 15:30 〜 17:30 W会場 (イベントホールD-E)

[1Win4-102] 大規模言語モデルと人間の協調行動

〇吉澤 駿1,2、茂木 健一郎2,3 (1.東海大学、2.ソニーコンピュータサイエンス研究所、3.東京大学)

キーワード:大規模言語モデル、人間とAIの協調、AIアラインメント

大規模言語モデル(LLM)の急速な発展に伴い、AI安全性やAIアラインメントの重要性が高まっている。特に人間とAIの協調(Human-AI Cooporation)において両者の協調の適切でロバストなメカニズム、原理の解明が必要である。私たちはLLMと人間の協調行動がどのように異なるか、ゲーム理論的、経験的に評価し、明らかにする。被験者(人間/LLM)の相手プレイヤーに対する信頼の違いを評価するため、ゲーム理論におけるスタグハントゲームに基づき課題を設計した。スタッグハントゲームは、互いのプレイヤーが協調すると報酬が増加するように設計された協調ゲームの1つである。被験者は相手と被験者自身が(シカ, シカ)と(ウサギ, ウサギ)の二つの純粋ナッシュ均衡の選択肢を持っていると仮定した。スタグハントゲームに基づき、相手プレイヤーが人間やLLMの場合等において、被験者の取る戦略がどのように変化するかを比較、評価した。被験者の相手が協調行動を取るかどうかの不確実性について確信度としても表現し、評価した。結論として、LLMは特定の相手に対して協調行動を取らないことが示唆された。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード