本發明涉及強化學習、傳統控制和多智能體等領域,為提出一種面向圍捕任務的基于多智能體確定性策略梯度和避障機制的多無人機智能協同決策方法,考慮狀態部分可觀測的特點、任務環境動態性與不確定性因素的影響,采用多智能體確定性策略梯度方法和避障機制,獲得最優行動策略,達到多無人機智能協同決策的目的,本發明,面向圍捕任務的多無人機智能協同決策方法,首先基于比例控制和避障機制建立初步決策方案,隨后采用多智能體確定性策略梯度方法對初步決策方案進行評價改進,獲得最優行動策略,最后,在線應用優化后的網絡實時給出決策結果,完成面向圍捕任務的多無人機任務決策。本發明主要應用于多無人機智能協同場合。
聲明:
“面向圍捕任務的多無人機智能協同決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)