抄録
CF-002
モデルベース強化学習における自動計画を用いた探索戦略
速水陽平(電通大/ニューヨーク州立大)・Saeid Amiri・Kishan Chandan・Shiqi Zhang(ニューヨーク州立大)・高玉圭樹(電通大)
不確実な環境のもとで,エージェントが人から与えられたタスクを達成するには,自律的な学習は必須である一方で,莫大な試行錯誤による探索コストが課題となっている.本研究では,人からの知識とノウハウに基づいた効率的な学習に着目し,モデルベース強化学習によるエージェントの探索戦略として宣言的知識を利用した自動計画を用いる手法を提案する.提案手法の有効性をシミュレーションと実ロボットを用いたナビゲーションタスクにおける学習性能と探索領域の削減度合いの観点から検証する.実験結果より,提案手法は学習性能を低下させることなく,探索空間を削減することが可能であることが示された.