報酬とペナルティを導入した数当てゲームの提案と均衡戦略の分析

吉岡 陸; 櫻井 祐子; 小山 聡; 篠田 正人

[4Xin1-28] 報酬とペナルティを導入した数当てゲームの提案と均衡戦略の分析

〇吉岡陸¹、櫻井祐子¹、小山聡²、篠田正人³ (1.名古屋工業大学、2.北海道大学、3.奈良女子大学)

キーワード：マルチエージェント強化学習、Min-Max Q学習、ゲーム理論

我々はまずn枚のカードから1枚の正解を当てるという数当てゲームについて，報酬とペナルティを導入した新たなゲームの提案を行う．次に，そのゲームにおいて，問題作成者と回答者の均衡戦略を分析する．具体的には，均衡戦略を求める問題を線形計画問題として定式化するとともに，マルチエージェント強化学習の一種であるMin-Max Q学習を用いて均衡戦略を求める．計算機実験によって，それぞれの手法を用いて解を求め，計算時間の比較を行う．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4Xin1] ポスターセッション2

[4Xin1-28] 報酬とペナルティを導入した数当てゲームの提案と均衡戦略の分析

パスワード