本發明提供了一種基于深度強化學習的共生無線電智能抗干擾方法,所述共生無線電網絡包括發射器、接收器以及干擾器,包括:在每個時隙,發射機根據感測到的狀態選擇動作與環境交互;發射機收到獎勵并感測下一個狀態,所述獎勵用于表示成功傳輸概率;獲取預設置的DDQN模型,通過DDQN模型通過查找最佳動作值函數Q*(s,a)確定該動作對應的動作值;判斷所述動作值是否為最佳動作值,且在所述動作值為最佳動作值時輸出最佳獎勵值。本發明提供的基于DDQN的模擬共生無線電網絡和干擾器之間的對抗,Q網絡使用Transformer編碼器實現,以從原始頻譜數據中有效地估計動作值,本發明能夠有效地防御多種干擾攻擊,從而最大限度地提高通信系統的成功傳輸率。
聲明:
“基于深度強化學習的共生無線電智能抗干擾方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)