本發明提出一種基于強化學習的配電網多時間尺度無功電壓控制方法,屬于電力系統運行和控制技術領域。該方法根據配電網慢速離散設備與快速連續設備的無功電壓控制目標,構建配電網多時間尺度無功電壓控制優化模型;基于該模型,構建基于雙層馬爾科夫決策過程的分層交互訓練框架,為慢速離散設備和快速連續設備分別設置對應智能體;各智能體根據輸入的量測信息決策所控對應設備的動作值,實現多時間尺度的無功電壓控制,同時兩智能體進行持續在線學習。本發明特別適合模型不完備問題嚴重的配電網使用,既節省重復維護精確模型的高昂成本,又充分挖掘多時間尺度可控資源的控制能力,最大程度上障配電網的電壓安全和經濟運行。
聲明:
“基于強化學習的配電網多時間尺度無功電壓控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)