情報処理学会第84回全国大会講演論文集

5C-05

二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究

○坂本充生（電通大），阿部拳之（サイバーエージェント），岩崎　敦（電通大）

本研究では，二人零和ゲームにおける突然変異付きレプリケータダイナミクスを利用した学習アルゴリズムの帰結を吟味する．
既存アルゴリズムの多くはダイナミクスの時間平均をとって初めて均衡に収束する．
しかし，敵対的生成ネットワークなどへの応用では時間平均を取らずに均衡に収束するアルゴリズムの方が望ましい．
そこで本研究では，突然変異付きレプリーターダイナミクスに基づく手法 Mutagenic Follow The Regularized Leaderを提案し，実験的に評価した．
その結果，このアルゴリズムのダイナミクスが時間平均を取らずに均衡に収束することを示した．