本發明公開了一種基于強化學習的十字路口交通信號燈控制方法,首先,將當前時刻十字路口的通行狀態表示成Position和Speed矩陣;其次,在傳統強化學習算法Deep Q?network的基礎上根據State的特征構建基于空間注意力機制的框架,其中主干網絡為卷積神經網絡;然后,根據貪婪策略隨機選取或者從模型預測一個Action執行。如果當前時刻的Action和前一時刻的相同,那么就直接執行綠燈相位時間,并在此過程中不斷訓練網絡;否則,首先執行黃燈相位時間,然后,再執行綠燈相位時間,同樣在此過程中同樣不斷地訓練網絡;最后,所有訓練回合結束后保存模型,然后測試并評估模型效果。本發明改進了現有的交通信號燈控制方法,使得車輛能夠更快的通過十字路口,一定程度上緩解了交通擁堵。
聲明:
“基于強化學習的十字路口交通信號燈控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)