本發明屬于自動駕駛技術領域,具體為基于深度強化學習的自動駕駛車輛交叉口無沖突合作方法,包括步驟1:交叉口問題馬爾可夫建模,綜合考慮安全約束馬爾可夫決策(constrained Markov decision process,CMDP)與馬爾可夫博弈(Markov Game,MG)理論,將道路交叉口環境轉化為為符合強化學習算法要求的模型;步驟2:單策略網絡與雙價值網絡更新過程設計,設計單策略?雙評論家(Actor?Critic1?Critic2)網絡架構;步驟3:馬爾可夫形式數據搜集;步驟4:強化學習訓練,訓練單策略?雙評論家(Actor?Critic1?Critic2)神經網絡;步驟5:強化學習測試,在仿真器Carla中實際測試該強化學習算法的性能,能夠針對時變的交通網絡拓撲結構輸出符合預期的車輛通行策略,在安全、舒適與效率方面均能夠獲得良好性能。
聲明:
“基于深度強化學習的自動駕駛車輛交叉口無沖突合作方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)