情報処理学会 第88回全国大会

7ZD-03
動作の成功・失敗データ間の差異を考慮した模倣学習手法の検討
○宮本佳奈(早大),鈴木彼方(富士通),尾形哲也(早大)
本研究では,成功データと失敗データの双方を活用するロボット模倣学習手法を提案する.従来の成功データのみを用いる模倣学習や,ロボットの自律動作の結果に基づく学習では,データ収集時に蓄積される失敗データを直接活用することが困難であった.本研究では,訓練データの成功/失敗ラベルに基づいて両データの分布差を捉える潜在表現を学習し,それを注意機構に導入する。これにより,推論時に適切な潜在モードを選択することで動作安定性が向上する.シミュレータ実験により,失敗データを含む状況において動作成功率が向上することを確認した.