6Q-04
依存関係を持つ複数のゴールを達成するための強化学習エージェントの実装
○北河英己,丁 世堯(京大)
既存の強化学習タスクでは主に単一の目標を追求するものが多いが、実世界では依存関係を持つ複数の目標を同時に達成する必要があるシナリオが多く存在する。既存の強化学習手法でもこのような複雑なタスクへの適応は可能だが、単純なタスクと比較すると性能はよくない。本稿では、マインクラフト風強化学習環境「crafter」を用いて、複数の強化学習手法の性能を比較し評価する。「crafter」は、依存関係を持つ複数のゴールを同時に達成する必要がある複雑なタスクを提供するため、本研究に適している。この研究により、依存関係のある複数の目標を含む複雑なタスクに対する強化学習アプローチの可能性と限界を明らかにする。