本發明公開了基于分層強化學習的無人機路徑規劃方法,包括:步驟1:初始化深度Q網絡算法、Q學習算法;步驟2:驅動無人機從起始點移動至目標點,對深度Q網絡算法、Q學習算法進行訓練;移動過程中當無人機未檢測到動態障礙物時,則使用深度Q網絡算法對路徑進行規劃;移動過程中當無人機檢測到動態障礙物時,則使用Q學習算法對路徑進行規劃;步驟3:重復步驟2直至深度Q網絡算法、Q學習算法訓練完成,設置無人機實際坐標、起點坐標、目標點坐標,通過訓練完成的深度Q網絡算法、Q學習算法對路徑進行規劃。本發明克服單個算法應用于動態環境時,存在的網絡擬合易受動態障礙物影響的問題,提升了算法路徑規劃的性能。
聲明:
“基于分層強化學習的無人機路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)