5Q-7
移動ロボットにおける走行特性を組込んだ方策の強化学習
○鈴木亮次,五十嵐治一(芝浦工大),石原聖司,田中一基(近畿大)
 エージェントが行動決定を行う際,動作特性を考慮あるいは利用した
方が効率的である場合がある.強化学習の一手法である方策勾配法
では,この動作特性を方策の中で表現し,学習中に動作特性を利用
することや,さらには動作特性自身をも学習することができる.今回,
上記手法を全方位移動型ロボットの最短時間移動問題へ適用した.
本ロボットは全方位移動型ではあるが,走行中に自転してしまう特有の
走行特性がある.本研究では,この走行特性を予め測定しておき,
タスクに必要な知識(状態価値パラメータ)とを分離した形で,方策関数
の中で表現する方式を採用した.本方式の有効性をシミュレーションと
実機による学習実験の両方で示す.