6P-01
完全情報ゲームにおける行動価値関数を用いた不完全情報ゲームの盤面推定
ゲームをプレイするプログラムを作成する際に、深層強化学習を用いることがある。しかし、単純な深層強化学習ではゲーム内の非公開の情報を推定することが難しい。そこで、本研究では不完全情報ゲームであるガイスターを題材として不完全情報の推定を行う方法の提案を目的とする。推定を行う方法として、ガイスターの非公開情報を公開情報とした完全情報ゲームのガイスターを定義し、深層強化学習を用いて完全情報ゲームのガイスターをプレイするプログラムを作成し、そのプログラムから得られる局面ごとの行動価値を用いて非公開情報の推定を行う。得られた推定方法をガイスターの対戦で試すことにより、推定方法の有用性を示す。