5R-6
Profit Sharingを用いたぷよぷよの学習
○小林 港,長名優子(東京工科大)
本研究では、Profit Sharingを用いて落ち物パズルゲームの1つであるぷよぷ
よの学習を行う。Profit Sharingのような強化学習では一般に試行錯誤を繰り
返していくことで、報酬を得るためのルールを獲得していくが、ここでは、人
間が実行した操作データをエピソードとして用いることで学習を行う。また、
Profit Sharingにより獲得したルールを解析することで、学習に用いる操作デー
タの違いにより、学習されるスキルの違いがみられることなどを確認する。