5Q-5
動的環境を対象とした適応的強化学習の提案
○齋藤智輝,大枝真一(木更津高専)
 学習は生物だけでなく人工システムにとっても,環境に適応するための重要な機能であると考えられる.
 従来の多くのシステムでは時刻によって動的に変化する環境(以下,動的環境)に適応させるために,設計者が状況に依らない環境(以下,静的環境)として,起こり得る変化をすべて事前に想定する必要があった.
 この場合,システムに個々に特化した学習をさせ,環境ごとに切り替えさせることも考えられるがこの手法では各環境に対して独立に学習を行っており,他の環境で学習した経験を次の学習に再利用していない.
 本研究では強化学習において従来の解法についての実験,動的環境下における効率的な解法について検討を行う.