本發明涉及電力系統運行和優化技術,旨在提供一種基于多時間尺度多智能體深度強化學習無功電壓控制方法。本發明將光伏、風機和負荷中的有載調壓分接頭、電容器組和儲能均定義為智能體,把基于強化學習的方法應用于無功優化問題中,允許控制器通過與類似系統的仿真模型交互來學習控制策略。將無功調節設備的動作變量與配電網環境進行交互,智能體最終能夠實現對于外部環境的最優響應,從而獲得最大的回報值。本發明用神經網絡方法來分析和擬合智能體的戰略函數和動作價值函數,訓練過程不依賴于預測數據結果和精確的潮流建模;使用兩個時間尺度的無功優化方法,可以使得網損更小、電壓平抑效果更佳,對提升配網安全可靠性有更顯著的效果。
聲明:
“基于多時間尺度多智能體深度強化學習無功電壓控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)