本發明公開一種基于分層強化學習的四足機器人運動規劃方法,該方法通過構建基于深度強化學習的上層行為決策控制器以及基于模型預測控制的下層運動執行控制器;對于上層的深度強化學習網絡,基于SAC算法設計四足機器人的狀態更新網絡、動作執行網絡以及獎勵函數等,結合機器人周圍的環境高度圖信息輸出對應的行為控制參數;對于下層執行控制器中的模型預測控制器,通過求解基于上層輸入的控制參數二次規劃方程組來獲取對應的控制指令。該分層控制框架結合了深度強化學習與模型預測控制的優勢,使四足機器人能夠根據當前機身狀態以及地形環境做出更安全可靠的行為模式,保持機身姿態平穩,從而有效規避風險,實現在復雜地形下的有效運動軌跡規劃。
聲明:
“基于分層強化學習的四足機器人運動規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)