本申請公開了一種智能車輛交叉口行為決策方法,方法包括:確定預設分層強化學習決策模型,包括上層路徑策略與下層動作策略;獲取智能車輛的環境觀測狀態,環境觀測狀態包括智能車輛的位置信息與速度信息以及障礙物的位置信息與速度信息;根據環境觀測狀態,通過上層路徑策略,生成智能車輛通過交叉口的轉彎半徑;根據環境觀測狀態及轉彎半徑,通過下層動作策略,得到智能車輛的縱向加速度;根據環境觀測狀態以及轉彎半徑,對下層動作策略進行更新,以對縱向加速度進行更新;根據轉彎半徑,通過預設策略獎勵函數,得到下層動作策略的回合總獎勵值;根據回合總獎勵值、環境觀測狀態、轉彎半徑,對上層路徑策略進行更新,以對轉彎半徑進行更新。
聲明:
“智能車輛交叉口行為決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)