本發明公開一種基于多智能體強化學習的時延容忍網絡路由算法,其特征在于,步驟包括:一、將時延容忍網絡節點進行Louvian分簇算法,提出了一種集中式加分布式的分層架構;二、結合正社會特性將DTN節點選擇下一跳問題建模為分布式部分可觀測馬爾科夫決策過程(Dec?POMDP)模型;與現有技術相比,本專利技術方案對比現有的基于社會屬性的時延容忍網絡路由方案,提出了一種分層架構,能夠方便地捕捉邊緣設備的社會信息;一方面分布式地執行計算中心下發的路由決策,另一方面在計算中心根據服務單元傳來的狀態集中式地訓練路由算法。能夠更有效地利用社會特性進行時延容忍網絡中的路由轉發,使得投遞率提高和平均時延降低。
聲明:
“基于多智能體強化學習的時延容忍網絡路由算法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)