本發明屬于水面無人艇軌跡跟蹤控制技術領域,具體涉及一種基于強化學習MPC的無人艇軌跡跟蹤控制方法。本發明在無人艇的MPC軌跡跟蹤控制器設計過程中,選用無人艇的運動學模型和操縱響應模型作為預測模型,根據無人艇軌跡跟蹤任務需求構造控制性能指標函數,在MPC滾動優化過程中利用強化學習的DDPG算法構建性能指標函數的求解器,通過最小化性能指標函數求解出軌跡跟蹤的最優控制序列,最終將每時刻控制序列的第一個控制量作用于無人艇系統上。本發明提高了軌跡跟蹤控制的魯棒性和抗干擾,同時具備自學習能力,適應于復雜的海況環境,相較于傳統的MPC控制算法其自主性和實時性更強,跟蹤誤差更小。
聲明:
“基于強化學習MPC的無人艇軌跡跟蹤控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)