本發明實施例提供一種面向空間博弈的策略梯度強化學習自主驅離策略,包括:選取一護衛星作為第一航天器和第二航天器的參照點,獲取第二航天器的預定的水滴運動軌跡,在仿真環境中建立CW軌道相對運動學模型;獲取t0時刻第一航天器和第二航天器的觀測量,根據所述水滴運動軌跡獲取所述第二航天器的速度增量;將t0時刻第一航天器的觀測量輸入訓練效果收斂的動作網絡計算t0時刻所述第一航天器的速度增量,進行軌道控制;計算t0+T時刻第一航天器觀測量,根據所述t0時刻第二航天器的速度增量計算t0+T時刻第二航天器的觀測量;根據t0+T時刻第一航天器和第二航天器的觀測量計算距離并進行驅離判定。利用本發明實施例提供的技術方案可以實現航天器之間的準確驅離控制及判定。
聲明:
“面向空間博弈的自主驅離方法、裝置和存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)