2B-04
二人零和マルコフゲームにおける状態抽象化法に関する研究
○石橋宙希(電通大),島野雄貴(無所属),阿部拳之(サイバーエージェント),岩﨑 敦(電通大)
本研究は,規模が大きい二人零和マルコフゲームの均衡解を計算するため,マルコフゲームの状態を抽象化する方法について吟味する.二人零和マルコフゲームとは,エージェントの利得がお互いの行動だけでなく,環境を表す状態によって決まるゲームであり,その状態遷移はマルコフ過程にしたがう.例えば,サッカーのようなゲームでは,場面場面の状態によって行動の価値が変わるため,マルコフゲームとして記述する.しかし,それがもつ状態の数はゲームの要素の数に対して指数的に増加するため,その均衡計算が困難になる.そこで本研究では,通常のマルコフ過程の状態を抽象化する方法を拡張し、どの程度の情報が失われるかを吟味する.