本發明提供了一種基于深度強化學習的地鐵站空調系統節能控制方法,該方法通過采集地鐵站空調系統數據參數;對采集的數據進行滑動平均濾波處理、歸一化和反歸一化處理并利用線性函數轉換方法將數據轉換成0?1范圍內的數值;利用神經網絡和步驟獲得的數據構建地鐵站空調系統的神經網絡模型;確定DDPG智能體的狀態變量、動作變量、獎勵信號以及結構;利用多步預測的DDPG算法求解最后的控制策略,本發明提出的控制方法具有很好的溫度跟蹤性能,與傳統DDPG算法相比,智能體訓練次數減少了86次,且能夠在系統負荷變化的情況下使系統穩定運行,滿足車站溫度需求,同時與目前實際工程中的運行系統相比,節能17.908%。
聲明:
“基于深度強化學習的地鐵站空調系統節能控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)