5Q-1
学習の効率化を目的とした粗視化を用いた強化学習
○細井健輔,能登正人(神奈川大)
強化学習の代表的な手法の一つとしてProfit Sharingがある.Profit Sharingは状態数が大きい場合には学習が困難となり,学習の効率が著しく低下するため,状態数が大きくなりやすい実問題への適用は難しい.この問題を解決するために,観測情報の一部を同一の状態であるとみなすことにより,状態数の削減を図る「粗視化」がよく用いられている.
しかし,状態空間の大きさによっては粗視化による知覚制限を行うことによって学習の精度が低下する.
 本研究では,報酬に工夫を加えることによって粗視化を用いた状態でも,状態空間の大きさによらず学習の高速化,効率化する手法を提案し追跡問題によって評価する.