5T-4
POMDPs環境のための決定的政策を学習するProfit Sharingによるアーム型ロボットの行動学習
○吉田匠汰,長名優子(東京工科大)
本研究では、POMDPs環境のための決定的政策を学習するProfit
SharingをKFM (Kohonen Feature Map)連想メモリによって実現した
手法により、ロボットアームの学習を実現する。アームロボットの
動作としては先端に物体を掴ませ、圧力センサが四隅に設置してあ
る床の上に物体を運ぶ。目標地点に物体が置かれているときのZMP
(Zero Moment Point)とロボットが物体を床の上に置いたときのZMP
との差に基づいて報酬を決定する。学習により目標地点の場所に応
じたアームの制御方法の獲得を実現を目指す。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について