[4Xin1-28] 報酬とペナルティを導入した数当てゲームの提案と均衡戦略の分析
キーワード:マルチエージェント強化学習、Min-Max Q学習、ゲーム理論
我々はまずn枚のカードから1枚の正解を当てるという数当てゲームについて,報酬とペナルティを導入した新たなゲームの提案を行う.次に,そのゲームにおいて,問題作成者と回答者の均衡戦略を分析する.具体的には,均衡戦略を求める問題を線形計画問題として定式化するとともに,マルチエージェント強化学習の一種であるMin-Max Q学習を用いて均衡戦略を求める.計算機実験によって,それぞれの手法を用いて解を求め,計算時間の比較を行う.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。