本發明屬于無線通信技術領域,具體的說是涉及一種D2D系統中基于深度強化學習的功率分配方法。本發明的方案中為每個鏈路對都單獨構建一個深度神經網絡,不需要實時得到所有鏈路的信道信息,而是根據部分歷史信息和其他鏈路地決策信息來預測當前鏈路周圍的通信環境,讓各個鏈路對能夠相互配合進而進行實時的功率決策以最大化全局網絡的加權和速率,從而實現了無需迭代的基于深度強化學習的功率分配方法。
聲明:
“D2D系統中基于深度強化學習的功率分配方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)