本申請提供一種列車追蹤控制方法、設備、存儲介質,該方法構建強化學習模型,強化學習模型包括數據預測模型和目標函數;獲取當前策略序列,策略序列與動作對應;根據數據預測模型,預測當前策略序列對應的動作在下一時刻的狀態;根據下一時刻的狀態,生成對應的下一時刻策略序列;根據目標函數,從下一時刻策略序列中選擇目標策略序列;基于目標策略序列進行列車追蹤控制。本申請的方法基于數據預測模型和目標函數進行列車追蹤控制,可以有效解決現有控制算法針對復雜系統精確建模困難、參數整定不易以及動態參數調整等問題。
聲明:
“列車追蹤控制方法、設備、存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)