1R-3
段階的学習による高自由度ロボットの強化学習の効率化
○程原教文(早大),中村真吾(芝浦工大),橋本周司(早大)
一般的な強化学習を自由度の高いロボットに適用すると,状態空間が
指数関数的に広がることで学習時間が増加してしまう,いわゆる
「次元の呪い」問題が存在する.本研究では自由度の低いロボットの
学習結果を高い自由度を持つロボットの学習に利用することで,
短時間で学習できる段階的学習法を提案する.具体的には,まず
事前学習としてロボットの自由度を制限した状態での学習を
複数パターン行う.その結果を数学的操作により改変および統合し,
高次の状態空間全域における強化学習に利用する.実験では,
シミュレーター上における多関節アームロボットの動作獲得に本手法を
適用し,学習時間が低減することを確認した.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について