本發明公開了一種應用于?;翻h境下多機器人路徑規劃方法,屬于機器人路徑規劃技術領域。此方法應用于智能機器人,可以在動態性強的復雜?;翻h境下進行多機的全地圖巡檢,并對特殊事件實時編隊反應。該方法的核心算法是好奇心驅使算法與深度確定性策略梯度相結合的深度強化學習算法,該算法避免了同類算法中人工設計環境獎勵這一復雜繁瑣的步驟,而是通過智能體自身內在獎勵與稀疏的環境獎勵對未知復雜環境進行探索、適應;同時,多機器人之間采用多Agent協作學習算法獲得最優的協同工作策略。
聲明:
“應用于?;翻h境下多機器人路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)