二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究

坂本 充生

13:50 〜 14:10

[2T4-GS-5-02] 二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究

〇坂本充生¹、阿部拳之²、蟻生開人²、岩崎敦¹ (1. 電気通信大学、2. 株式会社サイバーエージェント)

[[オンライン]]

キーワード：ゲーム理論、展開型ゲーム、均衡戦略、学習

本研究では，二人零和展開型ゲームにおける突然変異を利用した乗算型重み更新の帰結を吟味する．二人零和展開型ゲームは不完全情報下の意思決定における重要な問題である．このゲームの均衡は線形計画法で求められるが，ポーカーなど大きなサイズのゲームを扱うことは難しい．この問題に対して，均衡戦略を近似する学習アルゴリズムが提案されている．しかし，既存アルゴリズムの多くは学習のダイナミクスの時間平均をとって初めて均衡に収束する．一方，標準形ゲームでは，突然変異の導入によって時間平均を取らずに均衡戦略を学習できることが明らかになっている．そこで本研究では展開型ゲームにおいて突然変異を加えたDilated Mutant Multiplicative Weight Updateを提案する．シークエンス型で戦略を表現し，突然変異の付きの乗算型重み更新でその戦略を更新する．実験の結果，提案手法が複数のゲームおいて時間平均を取らずに均衡戦略を学習することがわかった．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[2T4-GS-5] エージェント：アルゴリズム

[2T4-GS-5-02] 二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究

パスワード