12:00 〜 12:20
[4N2-J-7-01] 強化学習プレイヤー同士の繰り返し Battle of the Sexes Game におけるコーディネーションの実現
キーワード:コーディネーション、不確実性、ゲーム理論、強化学習、エージェントシミュレーション
利害対立下のコーディネーションの実現は,共同的行為を実現するために必要な基本的課題である.繰り返しのBattle of the Sexes Game (Iterated BoS, IBoS)は,繰り返し相互作用する主体間のコーディネーションの困難を定式化したゲームで,複数のナッシュ均衡が存在するため,コーディネーションの実現には,“ある均衡を他より優先する根拠がない状況で,どの均衡を選ぶべきか”という均衡選択の問題を解決する必要がある.これに関し,近年,限定合理的である人被験者が繰り返しゲームをプレイする経験を通じてコーディネーションを実現できることが示されている.そこで本研究では,IBoSのプレイヤーとして強化学習を導入し,このプレイヤー同士のIBoSの均衡構造を分析した.理論および計算機シミュレーションによる分析から,このゲームでは,“各人にとって望ましい状態を交互に実現する”という協力的なターンテイキングが唯一のナッシュ均衡となることが示唆された.これは,強化学習がもとのゲームの均衡構造を変え,さらに,協力的なターンテイキングを実現するための可能なメカニズムとして機能する可能性を示している.