本發明公開了一種基于木馬攻擊的深度強化學習交通信號控制中毒攻擊方法,根據已有的深度強化學習DQN算法并加入木馬攻擊對交通路口信號燈控制模型進行訓練,通過修改指定位置的車輛信息生成異常交通狀態數據,再設定異常交通狀態數據下模型采取的異常動作,最后對該異常狀態下采取的異常動作設定較高的獎勵值實現深度強化學習DQN算法的中毒攻擊。本發明最后在模型測試過程中增加路口的車輛等待時間,大幅降低模型的性能,大大降低交通路口的車輛流通效率。
聲明:
“基于木馬攻擊的深度強化學習交通信號控制中毒攻擊方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)