本發明提供一種低軌衛星下行鏈路的功率分配方法,包括:低軌衛星初始化,建立馬爾科夫決策過程;觀測當前狀態St;根據探索因子的概率隨機選取動作或選取最優動作;根據動作at獲得新狀態St+1和當前狀態St的即時獎勵rt,將(st,at,rt,st+1)四元組存儲到經驗池中;當循環周期大于訓練數量時,對當前網絡進行訓練;在當前時隙為目標網絡更新頻率的整數倍時,更新目標網絡的參數;當前時隙增1;重復上述步驟直到當前時隙大于時隙計數器,當前時隙設為1且循環周期的計數增1;重復步驟直到循環周期大于訓練網絡周期數。本發明的分配方法采用深度強化學習算法來動態分配多波束低軌衛星的子載波功率,從而最大化低軌衛星的容量,提升頻譜效率。
聲明:
“低軌衛星下行鏈路的功率分配方法及功率分配裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)