本發明公開了一種基于積分強化學習的核電功率跟蹤控制方法,包括:初始策略選取,相關參數初始化,初始功率點與期望功率點選??;開啟全局迭代,開啟局部迭代,利用策略迭代積分強化學習算法訓練評價網絡,修正網絡權值,其中評價網絡用來近似跟蹤誤差性能指標函數,并利用該評價網絡權值評測當前跟蹤誤差控制系統的性能,通過執行流程選擇最優控制策略,最小化一次全局迭代的總成本;判斷當前局部迭代是否完成,若否,則返回局部迭代,否則更新迭代性能指標函數和跟蹤控制律,以獲得最優跟蹤控制策略;全局策略迭代完成,得到最優跟蹤控制策略,跟蹤到期望功率點,計算總成本。由此,本發明可以不斷地學習、調整當前策略跟蹤到期望功率點。
聲明:
“基于積分強化學習的核電功率跟蹤控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)