本發明公開了一種基于多智能體深度強化學習的MU?MISO混合預編碼設計方法,適用于通信中下行系統使用。該方法中基站構建多個用于計算模擬預編碼矩陣的深度強化學習智能體,每個智能體包含一個動作預測網絡及一個帶優先級的經驗池,各智能體共用一個中心化的獎勵值預測網絡和一個中心化的評價網絡,協同探索模擬預編碼策略。該方法中基站獲取多個用戶的信道狀態信息,將用戶信道信息輸入所構建的智能體,輸出相應的模擬預編碼矩陣;進而通過迫零預編碼和注水算法計算包含各用戶數字預編碼向量的數字預編碼矩陣。其能有效解決大規模MIMO系統中混合預編碼設計復雜度高且可達速率性能不佳的問題,且對信道環境具有較強的魯棒性。
聲明:
“基于多智能體深度強化學習的MU-MISO混合預編碼設計方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)