情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

2S-06
「一般化塗りつぶし問題」におけるマルチエージェント強化学習
○岩井大河,三宅陽一郎(立教大)
本研究では「一般化塗りつぶし問題」にボトムアップ型のマルチエージェントとトップダウン型指揮官モデルを実装し、合計10Mステップ分の学習をさせ、様々な観点から比較をした。この問題は複数のエージェントで平面全体を塗りつぶすゲームであり、お掃除ロボなど複数のロボットを協調させるアルゴリズムの探究にも利用できる。各エージェントには平面の座標を観測値として渡し、全体を塗り終わると各エージェントに報酬が与えられる。本研究で比較する目的は、平面の形状に応じてマルチエージェントと指揮官モデルのどちらが効率的なアルゴリズムかを判断するためである。複数のドローンに効率的に空間を探索させる手法として役立つ。