本發明公開了一種基于注意力模型和深度強化學習的無人車行駛決策方法通過構建感知模塊和決策模塊完成無人車行駛決策任務,具體為:通過搭建自注意力模型和長短時記憶網絡對感知模塊進行建模,然后通過自動編碼器模型對感知模塊進行訓練;利用卷積網絡和全連接網絡搭建決策模塊,所述決策模塊基于深度確定性策略算法。利用感知模塊對觀測數據進行降維,再利用深度強化學習決策模塊進行策略學習,并通過引入優先經驗回放的方法,提高數據樣本的利用率,從而提高算法的訓練速度。本發明方法通過在自動駕駛環境中進行模型訓練后,可以在復雜的道路環境中安全行駛,并根據環境的變化制定合理的駕駛策略。
聲明:
“基于注意力模型和深度強化學習的無人車行駛決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)