7D-03
変形可能な4脚車椅子におけるモード条件付きポリシー蒸留による歩行および車輪移動動作の統合
○赤見坂篤記,長尾 確(名大)
歩行モードと車輪モードを別々に学習した場合,姿勢差により中間の変形動作の獲得が困難となる。本研究ではIsaac Labを用いて両モードを独立に強化学習し,PSD解析により歩行移動の方が車輪移動より揺れが大きいことを確認し,地形に応じた柔軟な切替の必要性を示した。次に両方策の観測・行動対を用いて単一方策へ蒸留し,変形動作は範囲外として強制切替を行った上で,変形なしでは低速歩行でしか走破できない経路を評価した。その結果,統合方策は切替後も破綻せず車輪速度を活かして走行し,歩行単一方策より高い走破性能を示し,変形後姿勢でも破綻しない性能が確認され,変形動作学習への足掛かりが得られた。