一種基于具有動作自尋優能力的深度強化學習的智能發電控制方法,包括步驟1、確定狀態集S;步驟2、確定動作集Ak;步驟3、采集各個區域電網的實時運行數據:頻率偏差Δf和功率偏差ΔP,計算各個區域控制誤差ACEi(k)的瞬時值與控制性能標CPSi(k)的瞬時值;步驟4、確定當前狀態S與當前內部狀態h,再根據當前狀態S、內部狀態h以及獎勵函數,獲取某區域電網i的一個短期獎勵函數信號Ri(k);步驟5、通過計算獲取目標Q值函數yk與損失函數Lk;步驟6、通過計算更新權值θk和步驟7、搜索并評估新動作,更新動作集Ak+1;步驟8、對所有區域電網執行相應操作;步驟9、返回步驟3。本發明可有效獲取電網最優協調控制,可從自動發電控制角度,解決大規模新能源以及分布式能源接入,為互聯電網所帶來的強隨機擾動問題。
聲明:
“基于具有動作自尋優能力的深度強化學習的智能發電控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)