本發明提供了一種基于深度強化學習的動態電力系統經濟調度方法,將動態經濟調度轉化為多階段序貫決策模型,本發明將進行動作決策的調度中心作為決策主體,實際電力系統作為環境,通過對強化學習中動作、狀態、獎勵等元素的設計,將電力系統的經濟調度模型轉化為典型的多階段序貫決策模型。該模型避免了對日益復雜的電力系統進行建模,且不要求精確的火電機組出力成本函數,通過智能體與環境的不斷交互,更新策略,自適應負荷與新能源出力的不確定性,實現任意場景下的電力系統動態經濟調度。
聲明:
“基于深度強化學習的動態電力系統經濟調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)