情報処理学会 第87回全国大会

7R-05
AlphaZeroによる円形リバーシAIの構築とその戦術の調査
○渡邊拓弥,鈴木徹也(芝浦工大)
現在、円形リバーシにおいていくつかのゲームAIが構築されているものの、未だ十分な実力を持つゲームAIは開発されておらず、有力な戦術の発見も進んでいない。本研究では、チェス、囲碁、将棋において成果を上げているAlphaZeroの手法と、二人零和有限確定完全情報ゲームで有効な探索アルゴリズムであるαβ法を組み合わせることで、より高度な円形リバーシのゲームAIを構築する方法を提案する。また、有力な戦術の調査のために、AlphaZeroで用いられる畳み込みニューラルネットワークから有力な盤面評価関数を構築する手法についても検討した。