本發明公布了一種數據驅動的多智能體系統PID控制協議自學習方法,本發明針對PID控制的多智能體系統,提出最優一致性問題;將求解基于PID控制的控制協議參數轉化為求解一個非零和博弈問題,提出了一種非策略Q學習算法,實現PID控制協議參數在線自學習以及多智能體系統的最優一致性;將強化學習(RL)技術和神經網絡函數估計方法相結合,不要求智能體系統動態已知,完全利用可測量數據自學習PID控制協議參數。本發明方法不需要知道多智能體系統的動力學模型,就能使所有智能體達到一致狀態,即達到一致性,同時能保證多智能體規定性能的最優性。
聲明:
“數據驅動的多智能體系統PID控制協議自學習方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)