抄録
F-003
GANを用いたモデルベースな深層強化学習に関する考察
◎丸山元輝・遠藤聡志・山田孝治・當間愛晃・赤嶺有平(琉球大)
深層強化学習の主流であるモデルフリーの学習では、経験則のみを用いて学習を行うことができるが、膨大な経験を必要とし学習に時間がかかる。そこで、モデルベースな手法を用いることで、効率的な学習を行うことが試みられている。Azizzadenesheliらの先行研究ではDQNを使用したモデルベースな手法を実装する際に、次の状態を予測することができるように学習したGANと、報酬を推定するモデルを組み合わせて先読みとDyna-Qアルゴリズムを用いた。しかしながら、GANの予測と報酬推定が実現できている反面、DQNの学習がうまく進まない。そこで、先行研究に関する改善の実験による考察検討を行う。