本發明公開了屬于新能源汽車優化管理技術領域的一種基于深度強化學習的集群電動汽車充電行為優化方法。本發明為基于雙延遲深度確定性策略梯度算法,實現對電動汽車的功率連續可調充電過程進行建模,訓練智能體控制充電功率,優化電動汽車充電行為,將分時電價高時的負荷向電價低時進行轉移,達到減少用戶充電開銷,平抑電網峰時負荷的目的;相較于傳統的優化控制方法,TD3在速度和靈活性上優勢明顯,且可以有效克服以往的強化學習方法動作空間離散、訓練收斂困難、穩定性差的問題。為增強智能體的泛化能力,本發明在原有狀態觀測上添加噪聲,模擬一組初始SOC不同,到達與駛離時間各異的電動汽車,并擴展到集群電動汽車充電行為控制。
聲明:
“基于深度強化學習的集群電動汽車充電行為優化方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)