一種基于行車風險分析的車輛強化學習運動規劃方法,包括:獲取本車所在車道的兩側邊界信息由車道兩側邊界點橫縱坐標(Xr,Xl)以及本車到左右兩側邊界的垂直距離(dl,dr)組成;利用高精度地圖和雷達獲取狀態信息數組由本車坐標位置(X,Y)、障礙物的坐標位置(Xobs,Yobs)和相對速度Δv組成;距離Δv=[Δv1,Δv2,...,Δvn],n是檢測到的障礙物數量;將和組合成狀態向量相對狀態信息輸入基于深度強化學習的車輛運動規劃模型Φ,以輸出本車動作向量action=[a,θ],其中a∈[?amax,amax]是加速度動作,amax為最大加速度,θ∈[?θmax,θmax]是方向盤轉角動作,當θ∈[0,θmax]時為向左轉動θ,當θ∈[?θmax,0]時為向右轉動θ;本車根據獲取的action行駛t時長后,判斷是否到達目的地,若是則結束工作狀態,否則進入步驟1進行下一時間步長的車輛控制。
聲明:
“基于行車風險分析的車輛強化學習運動規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)