本申請提供一種控制方法、裝置、存儲介質及電子設備。本申請實施例提供的控制方法,通過獲取用于表征待控設備物理狀態的狀態檢測參數,并將狀態檢測參數輸入至預設強化深度學習模型中,以確定與狀態檢測參數相對應的控制指令,其中,該預設強化深度學習模型是通過實際測量值所構成的第一數據樣本集以及根據預設仿真模型與第一數據樣本集所確定的仿真模擬值所構成的第二數據樣本集進行訓練得到的,從而使得基于真實數據以及模擬數據相結合所得到的強化深度學習模型所確定的學習策略的分布更接近真實策略分布,提高基于該深度強化學習模型所確定的控制指令與實際情況的匹配度。
聲明:
“控制方法、裝置、存儲介質及電子設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)