本發明屬于無人集群協同技術領域,具體涉及一種基于多智能體分層強化學習的弱觀測條件下無人集群協同方法。本發明首先對環境進行狀態定義,然后按照POMDP模型對狀態空間進行定義,包括觀察集合以及觀察函數,再隨機初始化一個由一系列概率值分布的信念狀態,同時根據傳統強化學習思想,設置狀態轉移函數、立即回報函數、折扣率、探索率等;然后采用基于MAXQ算法的分層強化學習框架,將無人集群的任務分層,達到對復雜的任務進行分而治之的目的,降低集群的參數維度,有效緩解計算機存儲不足和計算繁瑣的壓力,提高強化學習效率和精度。本發明能夠保證多個智能體參與協同任務時保持更高的效率和更好的協同效果。
聲明:
“基于多智能體分層強化學習的弱觀測條件下無人集群協同方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)