本發明提供的一種雷達智能認知抗干擾策略的生成方法,采用WR2L魯棒強化學習框架構建抗干擾策略生成網絡,作為FA雷達的代理,該框架能夠處理高維任務,并擁有較高的性能,在網絡訓練過程中,通過使用參數化的干擾策略和參數攝動后的網絡參數設計抗干擾策略,對神經網絡的部分權值進行優化攝動的干擾策略攝動方法,將獎勵根據一個雷達相干處理時間CPI中FA雷達代理的檢測概率計算得到,使得雷達能夠在環境和測試之間存在不確定性的情況下保持較高的抗干擾能力,減少生成魯棒抗干擾策略的計算量,與非魯棒性抗干擾策略相比抗干擾能力得到了較大提升。
聲明:
“雷達智能認知抗干擾策略的生成方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)