抄録
CF-004
非通信マルチエージェント強化学習における獲得報酬値の変動を用いたエージェント数の動的変化への追従
上野 史・髙玉圭樹(電通大)
マルチエージェント強化学習は,問題を複数エージェントによってモデル化したシステムを協調的に振舞わせるための学習方法である.しかし実問題のように動的変化する環境では協調的振舞いは変化し,適切に学習することは困難である.本研究は,動的変化の中でもエージェント数の動的変化に着目し,通信を行わずにその動的変化に追従した協調行動を学習する手法を提案する.エージェント数が変化すればシステム上の全エージェントの振舞が変化し,各エージェントの学習の手がかりである報酬の獲得量も変化する.そこで,本研究では学習毎の獲得報酬値の変動を観測し,その変動に追従して学習することでエージェントの数の動的変化に追従する.