本發明涉及一種基于強化學習的風蓄生態發電日隨機優化調度方法,包括:預先構建目標函數,所述目標函數以風電?抽蓄聯合系統實際出力與計劃出力偏差平方的期望值最小為目標;獲取當前風電出力實際值和風電出力預測值;利用Q(λ)?learning算法迭代求解目標函數,得到調度策略:將當前水庫容量作為狀態初始值,利用啟發式貪婪策略在水庫進出流量集中選取動作,利用資格跡函數提取動作資格,利用啟發函數提取動作的啟發信息;計算執行當前動作的獎勵值并更新Q值,得到Q值表;根據Q值表確定調度策略。
聲明:
“基于強化學習的風蓄生態發電日隨機優化調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)