本發明公開了一種基于粒子注意力深度Q學習的部分觀測路口自主并道方法,著眼于路口場景、車輛并道任務、觀測視野被樓宇和其他車輛遮擋住的部分觀測條件,使用強化學習中的深度Q學習算法對給定路線的并道車輛的駕駛行為進行優化。使用低維物理信息量作為車輛的觀測表征;使用基于粒子的表示處理因遮擋造成的部分觀測問題;通過引入注意力機制優化狀態表示,使模型可以僅接受未被遮擋到的車輛信息同時具有輸入排列不變性;使用深度Q學習算法根據獲取到的社會車輛信息輸出當前最優駕駛動作;通過在經驗回放池中加入多種車流密度下的采樣數據,結合優先經驗回放技術,使自主并道行為可以適應真實環境下多變的車流密度。
聲明:
“基于粒子注意力深度Q學習的部分觀測路口自主并道方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)