本發明提供了一種使用平均場動作價值學習優化車間作業排程的方法,屬于人工智能和運籌優化交叉領域。本專利使用多智能體馬爾科夫決策過程建模車間作業排程的一次求解過程,在此過程中設備作為智能體根據本地觀測選擇作業進行加工,而且每個作業按生產的時長被動態劃分為子作業。本方法使用模擬器處理對應現實條件的復雜約束,由多分類平均場強化學習算法進行多目標優化,從而對車間作業排程問題的痛點進行解耦,專注優化訂單出貨代價時能將生產周期整體時間壓縮約30%,每個訂單平均等待時間壓縮約35%。
聲明:
“使用平均場動作價值學習優化車間作業排程的方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)