本發明涉及一種強化學習結合循環網絡的機器人路徑規劃及控制方法,該方法包括:構建生成機器人路徑的循環網絡,所述的循環網絡依次生成機器人路徑中的路徑點;采用強化學習方法訓練所述的循環網絡;利用訓練的循環網絡執行機器人路徑規劃;控制機器人按照規劃的路徑點依次移動。與現有技術相比,本發明能夠在局部信息受限的同時極大程度上對未知環境進行推理,節約資源,提升效率,實現可觀測范圍內的可行路徑規劃,從而在復雜場景下能夠找到目標點,實現機器人的移動控制。
聲明:
“強化學習結合循環網絡的機器人路徑規劃及控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)