本發明公開了一種基于強化學習的多徑動態復用與分組傳輸方法,1)將時間劃分為以100ms為長度的時間片,并進行順序編號1,2,……,t,t+1,……;2)在每一個時間片的尾部,收集影響和反映各個鏈路傳輸質量的因素,將這些數據進行標準化后做為外部環境觀測值;本發明基于深度強化學習的鏈路捆綁傳輸技術,將鏈路捆綁傳輸控制作為智能體,將傳輸中影響鏈路質量的因素作為環境,鏈路后續的傳輸質量和穩定性作為獎勵和懲罰,從而建立強化學習模型,通過深度神經網絡對策略進行不斷優化,從而達到不斷優化傳輸策略的目的;具備更好的前瞻性。
聲明:
“基于強化學習的多徑動態復用與分組傳輸方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)