本發明公開了一種基于強化學習算法的超冗余機械臂自主抓捕空間碎片方法,包括S100:服務航天器通過攜帶的測量裝置獲取空間碎片信息;S200:服務航天器接近空間碎片,實現與空間碎片的軌道運動同步,并調整自身姿態;S300:基于空間翻滾目標是處于自由漂浮狀態的動態物體這一事實,采用馬爾科夫決策過程對抓捕過程進行建模,得到超冗余機械臂抓捕空間碎片的抓捕模型;S400:對空間碎片抓捕過程中的多元約束進行數學化的表征;S500:根據強化學習方法求解馬爾科夫決策過程的最優策略,得到一條超冗余機械臂從初始構型到成功抓捕住空間碎片構型的抓捕路徑,并根據抓捕路徑進行抓捕。該方法能夠自主性地規劃超冗余機械臂從初始構型到成功抓捕住空間碎片構型的抓捕路徑。
聲明:
“基于強化學習算法的超冗余機械臂自主抓捕空間碎片方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)