本發明公開了一種基于ARS強化學習算法的行星飛行避障制導方法,首先設置飛行器動作空間、飛行器狀態空間、獎勵函數,然后設置ARS算法超參數,采用神經網絡實現飛行器避障功能;運行ARS算法,與環境交互獲取經驗并不斷更新神經網絡,學習避障制導律;訓練多個回合后算法收斂即獲得避障制導律;當障礙物距離飛行器的距離在飛行器探測范圍內時,將飛行器探測范圍的邊界圓作為探測邊界,探測邊界外為安全區,探測邊界內為預警區;當飛行器在預警區內時需要啟動避障制導律避障,否則正常飛行。本發明方法是一種相對簡化的無模型強化學習算法,采用適宜解決連續行為問題的線性策略,具有較高的效率和魯棒性。
聲明:
“基于ARS強化學習算法的行星飛行避障制導方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)