7R-07
強化学習を用いた「ダイヤモンドゲーム」AIプレイヤーの開発
○今野 龍,藤原和彦(仙台高専)
近年,強化学習では汎用性向上を目指す研究が注目されている.そこで,将棋やチェスなどの二人プレイのゲームではなく,あまり研究が行われていない多人数プレイのゲームであるダイヤモンドゲームを着目した.多人数プレイのゲームにおけるAIプレイヤーの開発を通じて新たな知見を得ることで,強化学習の汎用性向上に寄与することが本研究の目的である.DeepMind社のAIであるAlphaZeroをベースに開発を行い,ボードのモデル化や状態・行動の定義などゲームのルールに関わる箇所を作成し,有効な次の盤面を取得可能にすることで,木探索の展開を可能にした.木探索と深層学習を適応し,AIプレイヤーを実現した.