本發明公開了一種基于深度強化學習的反應溫度控制方法和系統,該控制方法通過溫度控制模型輸出用于調整加熱時間和溫度的控制參數,其溫度控制模型基于柔性動作評價算法框架建立,可以通過深度強化學習的方式對溫度控制模型內部的策略網絡進行權重更新,使得在經過多次迭代學習后,策略網絡可以具備更好地預測準確性,從而提高控制參數輸出的合理性,同時使評價網絡所輸出的評價值可以在該過程中對策略網絡輸出的控制參數進行準確的評價,反向地對控制參數的調整作出指導,最終的目的均是使得控制參數可以更為準確地控制加熱設備,從而使膠體金制備過程中的溫度可以實現動態的穩定,減少外界因素的干擾,從而達到最優的制備效果。
聲明:
“基于深度強化學習的反應溫度控制方法和系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)