本發明公開了一種基于深度強化學習的自動駕駛行為一體化決策方法,從兩種基本駕駛行為,即換道和跟馳行為的優先級和邏輯出發,首先采用上下兩層深度強化學習模型處理大規?;旌蠣顟B空間并保證換道決策和跟馳決策的復合動作輸出,在上層模型中使用D3QN算法來區分環境的潛在價值和換道決策的價值,在下層模型采用DDPG算法處理跟馳決策從而輸出連續的車速控制。選取混合標準駕駛工況對兩種算法進行耦合訓練之后,在利用NGSIM數據重建的高度復雜的駕駛場景中對模型進行測試。本發明提出的集成駕駛決策模型提高了跟馳與換道決策的協同性,并將車道優勢函數與危險動作屏蔽機制整合到決策模型中,顯著提升了行駛速度,優于其他的智能駕駛決策模型。
聲明:
“基于深度強化學習的自動駕駛行為一體化決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)