本發明涉及一種基于模型和強化學習混合切換的車輛路徑跟蹤控制方法,包括以下步驟:根據規劃層給出的軌跡和車輛運動學模型,使用模型預測控制算法得到控制策略一(控制策略包括對油門、剎車和方向盤的控制);同時根據規劃層給出的軌跡,使用深度強化學習中的演員網絡得到控制策略二;根據當前的車輛狀態和環境狀態信息,使用深度強化學習中的評論家網絡對兩種控制策略進行評估,并選擇能夠獲得更高價值的控制策略進行實際的輸出,實現車輛的路徑跟蹤控制。與現有技術相比,本發明將基于模型的經典方法和基于學習的新興方法融合,具有靈活性強、穩健性好、控制性能更優等特點。
聲明:
“基于模型和強化學習混合切換的車輛路徑跟蹤控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)