本發明涉及一種基于強化學習的模型預測控制軌跡跟蹤控制系統,包括線性時變模型預測控制器、規劃模塊、狀態估計模塊以及強化學習模塊,所述線性時變模型預測控制器包括預測模型、優化求解模塊和目標函數+約束條件模塊;預測模型的預測軌跡結合規劃模塊的參考軌跡輸入給優化求解模塊,對目標函數和約束條件進行求解,計算出最優控制量發送給被控車輛執行;車輛執行命令后得到狀態量反饋給狀態估計模塊、規劃模塊、強化學習模塊;狀態估計模塊根據反饋狀態量修正模型誤差;規劃模塊進行局部路徑規劃;強化學習模塊根據參考軌跡與實際車輛位置差值調整車輛MPC控制誤差權重參數,適配行駛道路與軌跡,提高控制精度。
聲明:
“基于強化學習的模型預測控制軌跡跟蹤控制系統及方法方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)