本發明公開了一種基于強擾動檢測與模型再訓練的深度強化學習交通信號控制中毒防御方法,該方法首先利用強擾動獲取輸入數據中的后門數據,再對后門數據進行識別進一步確定異常數據點,最后可通過數據層面的防御將測試過程中異常數據的異常數據點進行去除,或是通過模型層面的防御將原始訓練數據與反向觸發器重構訓練集對中毒模型進行忘卻學習使得中毒模型忘卻觸發器引發的異常行為。本發明通過檢測方法首先將異常交通狀態數據篩選出來,只需在后門數據子集中尋找“反向觸發器”而無需對所有輸入數據進行計算,最后通過兩個層面的防御方法對模型層面和數據層面進行防御,以此消除后門觸發器帶來的異常行為,提高交叉路口的車輛通行效率。
聲明:
“基于強擾動檢測與模型再訓練的深度強化學習交通信號控制中毒防御方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)