1ZP-02
タスク遂行とかわいさを両立したロボットの行動生成を目的とした強化学習環境
○杉山彩加,松岡丈平(東京工科大)
本研究は,機能特化型ロボットにおいてタスク遂行とかわいさの両立のため,軽度の失敗を導入した行動生成とその評価を目的とする.プラットフォール効果に基づき,軽度の失敗は親近感を高めるとされている.今回は軽度の失敗を導入可能な環境を構築した.具体的には強化学習用環境構築ライブラリGymnasiumを用いて経路探索中心の環境を設計し,学習可能であることを確認した.今後は,致命的失敗を避けつつ軽度の失敗を段階的に導入する報酬設計を行う.さらに,完全タスク,ランダム失敗を含む三条件で,社会的魅力の定性評価とタスク効率の定量評価を実施し,タスク遂行とかわいさの両立が社会的魅力度向上に寄与するか明らかにする.