利用深度強化學習的可變構航天器在軌自變構規劃方法,本發明涉及可變構航天器在軌自變構規劃方法。本發明的目的是為了解決現有方法對于稍微復雜的構型,算法復雜度大;無法進行規劃的問題。過程為:S1:初始化均值和目標網絡的參數;S2:根據目標網絡選擇組成自變構衛星的可動模塊動作;S3:化解碰撞沖突;S4:監測S3動作執行后運動模塊的狀態改變;S5:獲取每個模塊執行動作的收益;S6:選取模塊執行動作獲得的經驗,存儲在內存中;S7:從內存中選取樣本輸入均值網絡,得到訓練好的均值網絡;S8:將參數復制到目標網絡中進行更新;目標網絡輸入為模塊狀態、動作,輸出動作價值函數。本發明用于航天器在軌自變構規劃領域。
聲明:
“利用深度強化學習的可變構航天器在軌自變構規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)