情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

2S-03
RoboCup サッカーシミュレーション 2D リーグにおける模倣学習の改良
○岡崎弘侑,五十嵐治一(芝浦工大)
Robocupサッカーシュミレーション2Dリーグのサンプルプログラムであるagent2dでは、攻撃時のボール保持者の行動決定方として「チェーンアクション」という方法が採用されている。チェーンアクションでは、行動の候補を生成し、行動後の局面を評価関数によって評価することで、最も良い行動を決定する。本研究では、この評価関数をニューラルネットワークで近似し、学習することを試みた。学習では、はじめに、強豪チームが行った行動と、その行動が行われた局面を取得した。そして、その局面を再現し、行動候補を生成した。その後、強豪チームの行動を正解として、正解行動後の局面評価値が大きくなるように教師あり学習を行った。