本發明公開了一種四足機器人運動控制自生成和實物遷移方法。發明使用PPO算法優化四足機器人運動控制器,通過確定影響四足機器人運動控制性能的參數,學習魯棒的控制器來縮小仿真模型和實際模型的差異,提高遷移成功率。發明首先在仿真環境中實現控制策略的自主生成,然后將仿真中學習的運動控制器部署在實際的四足機器人上,通過慣性測量單元實時獲取四足機器人的位姿信息,由運動控制器預測四足機器人腿部的關節角度,輸出到對應電機,最終實現步態自主涌現。本發明解決傳統四足機器人控制建模難,環境適用性差且使用深度強化學習的控制方法多停留在仿真階段等問題,使深度強化學習算法應用在實際四足機器人的運動控制上,實現復雜適應性步態的快速自主涌現。
聲明:
“四足機器人運動控制自生成和實物遷移方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)