7P-05
RoboCupサッカーシミュレーション2Dリーグの守備における評価関数の設計と学習
RoboCupサッカーシミュレーション2Dリーグでよく用いられているベースチームプログラムとしてagent2dがある。agent2dの守備方法は、ボールの位置で定まる守備パターンに基づいて守備プレイヤの位置を決定しており、そのままでは相手プレイヤの位置を考慮することもなく、相手チームのパスやドリブルに対応できないことがよくおきる。
agent2dでは、ボール保持者の行動決定に探索木と局面評価関数を用いたチェーンアクションという機能が備えられている。本研究では、守備時の味方プレイヤの移動行動にもチェーンアクションを用いる。今回、新たに設計、学習した守備プレイヤ向け評価関数を用いることで守備力の向上を図った。
agent2dでは、ボール保持者の行動決定に探索木と局面評価関数を用いたチェーンアクションという機能が備えられている。本研究では、守備時の味方プレイヤの移動行動にもチェーンアクションを用いる。今回、新たに設計、学習した守備プレイヤ向け評価関数を用いることで守備力の向上を図った。