General Game Playing (GGP) は形式的に表現されたゲームルールを解釈することで、幅広い未知
のゲームをうまくプレイできるプログラムを実現する試みである。GGP においてはモンテカルロ木探索
が近年成功を収めているが、そのシミュレーション方策をどのように学習すべきかには未知の部分が多い．
本研究ではGGP の枠組みにおいて，方策の「強さ」とバランスという性質に関し着目し，既存の学習手
法を組み合わせることで「強さ」とバランスを両立を目指す新たな学習手法を提案する．新たな学習手法
は一部のゲームにおいて既存手法よりよい性能を示した．