1D-02
物体把持位置検出における逐次学習手法の検討
○鈴木彼方,横田泰斗,金澤裕治,竹林知善(富士通研)
本研究ではピッキングタスクの際の物体把持位置の検出において,動作成否に基づいて教示ラベルを追加していく逐次学習の効率化を検証した.ロボットが動作試行を通して逐次的に学習する際,限られた時間の中で効率的に学習する必要があるが,最適な正解ラベルが得られるとは限らない.提案手法では試行により得た把持位置を矩形表現として,逐次的な検出学習を行った.事前学習として,シミュレータで作成した対象物を抽象化したプリミティブな物体の学習を行った.またその際,成功度に比例した正則化項を加えた.実験の結果,学習の効率化と,学習後の把持位置の改善が確認された.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会