6P-07
モンテカルロ法の報酬の変更による花札「こいこい」の戦略構築
戦略を意識した花札のプレイヤAIの研究はあるが,単一の戦略であることが多い.しかし,花札は12局で1対局という繰り返しゲームの特徴を持っており,繰り返しゲームにおいては状況に合わせた戦略の選択が重要である.本研究では花札において,モンテカルロ法の報酬を変化させることで一般的だと考えられる複数の戦略を実現することを目的とし,各戦略に対応した報酬をそれぞれ提案する.各戦略がランダムプレイヤと対戦をしてランダムプレイヤおよび他戦略と勝率などの成績を比較することで戦略の評価をし考察する.