本發明屬于分布式路由技術領域,具體為一種基于多智能體深度強化學習的數據包路由算法。本發明為了緩解計算機網絡中的擁塞情況,利用多智能體深度強化學習技術,設計了一種端到端的自適應路由算法,各路由器依據局部信息完成數據包調度,降低了數據包的傳輸時延。本發明首先構建分布式路由的數學模型,明確強化學習中各要素的具體含義,然后對神經網絡進行訓練,最后在仿真環境下進行算法性能測試。仿真實驗結果表明,深度神經網絡的引入可以挖掘輸入網絡狀態中的特征信息,實現暢通路徑和最短路徑之間的權衡,與其他常用路由算法相比,本發明實現了更短的數據包傳輸時延。
聲明:
“基于多智能體深度強化學習的數據包路由算法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)