本發明公開了基于多智能體寬大強化學習的電力安全經濟調度方法。針對智能電網規模的不斷擴張,設計了多智能體寬大強化學習解決框架,采用深度學習擬合狀態?動作價值曲線,并融入了經驗池,可以普遍應用于電力系統的分布式經濟調度。針對新能源發電單元與網絡干擾帶來的成本函數不確定性問題,引入寬大強化學習的獎勵空間擬合機制,消除智能體與環境交互過程中的不確定性獎勵。采用信譽值評估各個智能體的安全狀態,應對多智能體系統可能遇到的網絡攻擊問題,并通過信譽值更新網絡通信權重,實現不安全節點的隔離。本發明實現了智能電網多發電機組分布式經濟調度問題的聯合求解,為復雜電網發電單元的安全、可靠、高效的調度提供可行的方案。
聲明:
“基于多智能體寬大強化學習的電力安全經濟調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)