本發明公開了一種基于強化學習的旋轉機械故障診斷網絡自動搜索方法,基于給定的診斷任務控制器根據子模型當前狀態對子模型進行設計,接著利用診斷數據訓練驗證子模型,其驗證精度又參與到對控制器的訓練。方法執行過程中,子模型和控制器交替訓練,最終控制器能針對具體診斷任務搜索出高診斷性能的子模型。在子模型訓練過程中,方法設置了權值共享,有著相同權值數量的網絡層在不同子模型中可重用,降低訓練時間提高了搜索效率;在控制器訓練過程中,應用了貪心策略,給予空間讓控制器自由探索降低陷入局部最優的概率,應用了經驗重放,讓控制器交替工作訓練避免學習過程中參數的振蕩和發散,還應用了迭代更新,使用副控制器來預測下一狀態的獎勵,降低了回報期望與未來收益的相關性,提高控制器的訓練穩定性。以上特點使得本發明方法在針對不同的診斷任務時能夠高效地搜索出具有高診斷性能的網絡模型,有效解決旋轉機械狀態診斷問題。
聲明:
“基于強化學習的旋轉機械診斷網絡自動搜索方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)