權利要求書: 1.基于多智能體TLBO算法的球磨機制粉優化控制方法,包括:建立球磨機制粉控制模型;對基本TLBO算法進行改進,包括教學因子TF的改進,改進之后的教學因子如式(1):式(1)中,令TF最大值TFmax,TFi的初始值設計TF1=1,iter_max表示最大迭代次數,iter表示當前迭代次數;建立控制器的狀態空間模型,將改進的TLBO算法用于球磨機制粉系統控制器的參數優化。2.根據權利要求1所述的球磨機制粉優化控制方法,其特征在于:基本TLBO算法的改進還包括多智能體構造,構造過程如下:構造多智能體狀態空間函數:在多智能體系統中當選取未經過學習的學員表示為智能體的聯合狀態空間S=[s1,s2,…sn],式中:s1~sn是未經過學習的學員的多智能體狀態空間;構造多智能體動作相位:使用聯合動作相位A=[a1,a2,…an]式中:a1~an為動作相位。3.根據權利要求2所述的球磨機制粉優化控制方法,其特征在于:基本TLBO算法的改進還包括Stackelberg博弈均衡:選取最優秀的學員作為領導者,目標函數為f領導者(x)f領導者(x)=max(U領導者智能體(s,[a1,…an]))式中:ωi(s,[a1,…an])學員群體中領導者智能體i的性能函數,θi(s,[a1,…an])學員群體中領導者智能體i的損失函數,n表示整個學員群體中領導者智能體的個數;最優化學員自身收益,目標函數為f跟隨者(x):f跟隨者(x)=max(U跟隨智能體(s,[a1,…an]))式中:φi(s,[a1,…an])學員群體中跟隨者智能體i的性能函數, 學員群體中跟隨者智能體i的損失函數,k整個學員群體中跟隨者智能體的個數。4.根據權利要求2或3所述的球磨機制粉優化控制方法,其特征在于:基本TLBO算法的改進還包括改進“學”階段:多智能體TLBO算法依次選中每一個學員,然后挑選一個優秀的學員作為比較,基于自學習的學習過程為:式(2)中:Xnew,i,表示第i個學員學習后的狀態值;Xold,i表示原來的狀態值;r1,r2表示[0,1]之間的隨機數。5.根據權利要求1~4任一項所述的球磨機制粉優化控制方法,其特征在于:控制器的狀態空間模型為:使用TLBO算法多智能體學員對控制器Ka,Kb統一進行編碼:設計多智能體TLBO算法的適應度函
聲明:
“基于多智能體TLBO算法的球磨機制粉優化控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)