General Game Playing (GGP) は形式的に表現されたゲームルールを解釈することで、幅広い未知 のゲームをうまくプレイできるプログラムを実現する試みである。GGP においてはモンテカルロ木探索 が近年成功を収めているが、そのシミュレーション方策をどのように学習すべきかには未知の部分が多い. 本研究ではGGP の枠組みにおいて,方策の「強さ」とバランスという性質に関し着目し,既存の学習手 法を組み合わせることで「強さ」とバランスを両立を目指す新たな学習手法を提案する.新たな学習手法 は一部のゲームにおいて既存手法よりよい性能を示した.