本發明提供了一種基于深度強化學習的無人礦卡循跡控制系統及方法,在學習階段下,通過仿真平臺接收環境狀態信息、控制動作信息模擬無人礦卡的循跡過程,采集無人礦卡在預設路線上各個時刻的狀態,將各個時刻的狀態作為輸入量,各個時刻控制動作信息作為輸出量進行深度強化學習訓練,得到算法內核;在應用階段下,獲取無人礦卡當前時刻的狀態和下一時刻的目標狀態至算法內核;基于算法內核預測出當前時刻的控制動作信息。本發明能夠實現無人礦卡運動軌跡的精確控制,可在不同工況、不同工作環境和狀態下按照深度強化學習訓練出來的算法進行自動循跡,具有高度智能化、自我學習、自我適應的特性;提高了礦卡循跡控制的效率,且可以減少燃油消耗量。
聲明:
“基于深度強化學習的無人礦卡循跡控制系統及方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)