本發明公開了一種基于強化學習的城市道路自動泊車方法,包括:S1、車位線識別流程,S2、狀態輸入流程,以及S3、泊車決策控制流程,其中,泊車決策控制流程包括:S31、Actor使用經驗池中計算好的狀態價值與Critic網絡預測當前狀態價值進行神經網絡的更新,用M均方差誤差作為Loss函數,對神經網絡進行訓練,得到更新后的目標神經網絡;S32、將狀態輸入向量輸入停車動作策略π*對應的更新后的目標神經網絡,輸出得到車輛的轉向角和加速度,控制車輛的移動。
聲明:
“基于強化學習的城市道路自動泊車方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)