本發明提供了一種基于深度強化學習的物理層欺騙檢測方法,主要解決現有物理層欺騙檢測方法中對于動態未知的無線環境,信道模型或參數難獲取,難準確地選擇固定檢測閾值的問題。其實現步驟為:1)建立欺騙攻擊場景,接收方提取收發雙方之間物理層信道信息表征物理層指紋特征;2)建立二進制假設檢驗模型;3)以動態的物理層指紋特征構建狀態值,以閾值數值選擇構建行為值,以貝葉斯風險函數作為瞬時效益函數,建立狀態?行為?效益三元組;4)基于深度確定性策略梯度框架,設計檢測閾值動態選擇方法,對物理層欺騙攻擊進行檢測。本發明可以實現檢測閾值的動態連續選擇且對于動態未知環境具有自適應性,有效地檢測物理層欺騙攻擊。
聲明:
“基于深度強化學習的物理層欺騙檢測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)