本發明公開了一種基于圖神經網絡和深度強化學習的路由優化方法及系統,屬于網絡路由優化領域。方法包括測量當前網絡狀態s,根據當前網絡狀態請求分配的流量需求,選取k條源節點到目標節點的最短路徑,作為動作集a;將動作集a輸入至圖神經網絡,聚合鏈路特征并迭代更新,經Q函數得到網絡狀態s和動作集a的估計Q值;根據估計Q值進行深度強化學習得到當前網絡狀態下的路由策略,將路由策略反饋給網絡拓撲執行相應的路由動作。本發明提出了基于圖神經網絡和深度強化學習的網絡路由優化體系結構,旨在利用圖神經網絡學習拓撲中圖元素之間的關系以及組成它們的規則,利用深度強化學習算法進行決策,從而優化網絡路由。
聲明:
“基于圖神經網絡和深度強化學習的路由優化方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)