情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

2S-02
Q学習を用いたRoboCupサッカーエージェントの2vs1の協調守備行動
○劉  号,五十嵐治一(芝浦工大)
Robocupサッカーシミュレーション2Dリーグはコンピューター上で仮想なサッカーの競技を行うリーグである。一般に、自律的なプレイヤエージェントを設計するには、エージェント同士の協調行動を考慮することが重要である。本研究では、サッカーの守備における2プレイヤの協調行動の獲得を目的とする。具体的には、ボールを保持する攻撃側のプレイヤと2人の守備プレイヤとがなす角度と距離に注目し、2対1の守備フォーメーションを強化学習により学習する。実験環境としてHalf-Full-Offense(HFO)を、強化学習としてQ学習を用いる。強化学習はカリキュラム学習の手法を用いて段階的に行う。