ルールの単純さと難易度の高さから,Ms. Pac-Man がデジタルゲームAI の研究対象として注目を 集めている.Ms. Pac-Man プレイヤでは,ルールベースを用いたプレイヤよりモンテカルロ木探索,特に UCT (Upper Confidence Bounds applied to Trees) を用いたプレイヤが優秀な成績を収めている.本研究 ではTD() 法で学習した評価関数を用いたUCT の改善について提案する.UCT における評価関数の利 用には,Progressive bias を用いた.Progressive bias ではUCT の序盤の展開を評価関数に従うようにし て有利な局面の探索を増やす.評価実験ではシミュレータ上で既存手法のUCT を大幅に上回る得点を獲 得した.