本發明公開了一種工業過程的優化學習控制性能提升方法。本發明在傳統狀態空間模型的基礎上,通過構建包含跟蹤誤差和狀態增量的新型狀態空間模型,在執行器新模型的基礎上提出性能指標并構建值函數與Q函數,最后通過設計非策略Q?學習算法進行最優控制律學習及性能指標的優化,得到最優的控制器增益,進而提升控制性能。本發明不依賴于系統的數學模型而是對大量在線數據的強化學習,這在實際系統狀態很難直接測量或者只能測量部分狀態信息的環境下有著突出優勢,可以有效地改善實際過程生產的控制性能,使得控制效果與控制精度得到提升。
聲明:
“工業過程的優化學習控制性能提升方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)