17:40 〜 18:00
[2O6-GS-5-02] 二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
[[オンライン]]
キーワード:エージェント、機械学習
本研究では,二人零和ゲームにおける突然変異を利用した学習アルゴリズムの帰結を吟味する.既存アルゴリズムの多くはダイナミクスの時間平均をとって初めて均衡に収束する.そこで本研究では,突然変異付きレプリーターダイナミクスに基づく手法Mutant Follow the Regularized Leaderを提案し,実験的に評価した.その結果,このアルゴリズムのダイナミクスが時間平均を取らずに均衡に収束することを示した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。