本發明屬于移動機器人導航技術領域,具體涉及一種靜態環境下基于深度強化學習的移動機器人避碰規劃方法。本發明使用激光測距儀采集原始數據,將處理后的數據作為A3C算法的狀態S,通過構建A3C?LSTM神經網絡,將狀態S作為網絡輸入,通過A3C算法,神經網絡輸出相應參數,利用參數通過正態分布選擇移動機器人每一步執行的動作。本發明無需對環境進行建模,通過深度強化學習算法最終實現移動機器人成功在復雜靜態障礙物環境下避障。本發明設計具有轉艏約束的連續動作空間模型,且采用多線程異步學習,與一般深度強化學習方法相比,大大提高學習訓練時間,減少樣本相關性,保障探索空間的高利用性與探索策略的多樣性,提升算法收斂性、穩定性以及避障成功率。
聲明:
“靜態環境下基于深度強化學習的移動機器人避碰規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)