本發明提供一種基于區塊鏈和強化學習的空調控制方法及其系統,該方法包括在空調啟動或正常運行時,基于接收到的控制指令和狀態參數s,根據獎勵機制產生在當前狀態下的執行獎勵;設定時間窗口Ti,判斷當前時間是否在時間窗口Ti內,若判斷結果為是,則直接啟動強化學習的計算任務,并輸出預測動作a;若判斷結果為否,則判斷是否有其他Master節點發送的計算任務,如是,則啟動計算任務;由區塊鏈節點記錄當前狀態、獎勵和動作,并將動作傳遞給空調,至此完成一輪計算任務。該系統應用于上述的方法。本發明應用于空調的節能控制領域,用以解決目前現有技術中存在的訓練困難、穩定性差、浪費計算資源、消耗電力等各種問題。
聲明:
“基于區塊鏈和強化學習的空調控制方法及其系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)