本發明涉及一種基于強化學習的模型未知多智能體一致性控制方法,屬于智能化領域。本發明首先在設計自適應分布式觀測器時采用的方案有三個步驟組成。第一,設計了一個自適應分布式觀測器來估計系統矩陣和leader系統的狀態。第二,在設計自適應分布式觀測器后提出了一種在線計算觀測器方程解的方法。第三,為排除極少數極端情況,在假設每個follower不知道leader系統矩陣的情況下,綜合了自適應狀態反饋和自適應測量輸出反饋控制來解決系統分布式一致性輸出調節問題。本發明根據所估計的狀態,采用基于強化學習的方法設計控制器,通過迭代的方法得到最優解,實現多智能體系統的最優控制。
聲明:
“基于強化學習的模型未知多智能體一致性控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)