本發明公開了一種基于強化學習的高超聲速飛行器航跡規劃方法,本發明根據航跡規劃分2個階段:離線訓練階段,訓練一個不依賴于固定環境的RL智能體作為航跡規劃的基線策略;在線規劃階段,RL?CEM利用環境模擬器預測未來的狀態進行規劃,之后選擇優于基線策略的策略作為執行策略,否則將使用基線策略。本發明提出的RL?CEM不僅有效地回避航跡規劃中的局部最優,還展現出了令人滿意的成功率。RL?CEM彌補了以往基于RL的航跡規劃方法容易陷入局部最優、規劃失敗時無替代方案的缺點。本發明的航跡規劃方法回避了高超聲速飛行器復雜的動力學,僅通過其運動學來解決該問題。
聲明:
“基于強化學習的高超聲速飛行器航跡規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)