2Q-07
強化学習に基づくマルチエージェント経路探索問題の環境構築
○西川昌弥,林 冬惠(岡山大)
マルチエージェント経路探索問題(Multi-Agent PathFinding: MAPF)とは,複数のエージェントが衝突せずにそれぞれの経路を探索する最適化問題である.先行研究では,部分観測や繰り返し探索などの動的要素を含むMAPF問題について,強化学習の手法が提案されている.しかし,様々な実世界のシナリオにおいて強化学習の手法を検証するためには,標準的なMAPF環境が必要となる.そこで,本研究では,動的要素をカスタマイズ可能なMAPF環境を構築し,既存の強化学習フレームワークとの接続を実現した.実験によって,様々な強化学習アルゴリズムを本研究で構築した環境上で検証できることを示した.