本發明涉及計算機技術領域,特別涉及一種基于深度強化學習的數據中心資源離線調度方法。深度強化學習可以為資源調度管理的人為啟發式方法提供一個可行的替代方案。通過不斷學習,深度強化學習方法可以針對特定工作負載(例如周期性負載或隨機負載)進行優化,并在各種條件下保持高質量優化調度結果。把最小化平均作業slowdown(系統減緩時間)作為優化目標,通過計算離線調度中每一次調度的獎勵值,引導深度網絡向著目標優化,最終向著最優目標訓練。結果顯示,在本發明的大量實施例測試中,使用深度強化學習的離線調度方法的slowndown遠低于SJF(最短作業優先算法)等傳統的優化作業調度方法,體現出深度強化學習方法在這一領域的優勢。
聲明:
“基于深度強化學習的數據中心資源離線調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)