2ZF-01
動的環境におけるSymmetric Value Iteration Networkの計算効率化
○平原龍希,長名優子(東京工科大)
Value Iteration Networksは、強化学習における価値反復アルゴリズムをニューラルネットワーク内部に組み込んだモデルで、経路探索などに適用される。Symmetric Value Iteration Networksは回転および反射対称性を組み込んだフレームワークであり、学習効率や汎化性能が向上することが知られている。本研究では、Symmetric Value Iteration Networksを動的環境に適用し、環境の変化が検出された領域とその周辺のみを再学習することで計算の効率化をはかる。