本發明公開了一種基于納什Q學習算法的交叉口聯合信號控制方法,屬于交通信號自適應控制技術領域,包括以下步驟:構建相鄰交叉口協調控制模型并確立強化學習的狀態、動作、獎勵信息;構建納什Q學習網絡控制模型;獲取模型訓練和測試數據;訓練納什Q學習網絡模型;對控制區域交叉口實施聯合協同控制。本發明在基于強化學習思想實現交叉口自學習控制的基礎上,考慮交叉口間存在的聯系對交叉口整體區域控制效果的,在交叉口的協同博弈中實現交叉口間的納什均衡控制。本發明通過博弈控制理論,實現相鄰交叉口間的協調控制,在一定程度上緩解了因相鄰交叉口缺乏合作機制而造成的擁堵問題。
聲明:
“基于納什Q學習算法的交叉口聯合信號控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)