本發明公開了一種基于神經網絡和強化學習的混合能量管理方法,屬于自動化技術領域。本發明采用模糊控制器的輸出作為神經網絡初始的離線數據集來進行訓練,應用學習得到的神經網絡產生新的數據加入至原有的數據集中,并反復更迭這兩個過程。針對每個時刻的狀態,采用訓練之后的神經網絡來預測當前狀態在采取相應動作之后轉移到的下一狀態,根據累計獎勵最大化的原則選擇一定長度的最優動作序列,選取動作序列的第一個動作作為當前狀態的最優控制動作。利用該方法可有效減少能量的浪費并且通過超級電容輔助鋰電池供電,減少了鋰電池的使用,達到了延長鋰電池壽命的目標。
聲明:
“基于神經網絡和強化學習的混合能量管理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)