情報処理学会第77回全国大会講演要旨

6R-04

複数のゴールが存在するマルチエージェント環境における社会的強化学習法

○木田椋子，長行康男（大手前大）

　強化学習エージェントにとって，目の前にあるゴールを無視して，遠くにあるゴールに向かうことは難しい．シングルエージェント環境の場合，エージェントは環境に対して貪欲であるべきで，目の前のゴールを無視する必要はない．しかしながら，マルチエージェント環境の場合，目の前にあるゴールを他エージェントに譲り，自分は遠くにあるゴールに向かうといった行動を選択した方が，社会性という観点から適切な場合がある．
　本稿では，複数のゴールが存在するマルチエージェント環境において，目の前にあるゴールを他のエージェントに譲り，自分は遠くにあるゴールに向かうといった社会性行動を獲得できる強化学習法を提案する．

情報処理学会 第77回全国大会講演要旨

情報処理学会第77回全国大会講演要旨