本發明涉及一種基于規則融合強化學習的自動駕駛換道決策控制方法,包括:建立他車縱向運動控制模型及橫向行為決策模型;配置高速公路駕駛環境,篩除不合理車流場景,構建自動駕駛決策訓練場景;建立駕駛行為觀測的狀態空間、動作空間;搭建用于策略更新的深度學習網絡;設計換道決策風險評估方法,建立決策的安全性評判機制;設置獎勵函數;將安全性評判機制引入基于DDQN的深度學習網絡;基于自動駕駛決策訓練場景進行融合訓練,修正決策出的危險動作,并設置兩個存儲經驗池,結合獎勵函數更新模型中目標價值網絡的參數,訓練后的模型用于自動駕駛換道決策。與現有技術相比,本發明在換道場景中具有更高的決策任務成功率、行駛效率以及安全性。
聲明:
“基于規則融合強化學習的自動駕駛換道決策控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)