潛航器對于國家海洋資源的勘探和保護具有重要作用,但是因為海洋環境的特殊性,潛航器在水下工作時無法與外界進行通信,因此設計具有自主控制能力的潛航器路徑規劃算法是其正常工作的重要保障。本發明針對復雜海洋環境中的路徑規劃任務,在python仿真環境中使用decisiontransformer算法控制潛航器的運動。因為decision transformer使用軌跡序列進行動作的預測和控制,因此擺脫了傳統強化學習算法對輸入狀態馬爾可夫性的要求,可以在洋流未知的部分可觀測環境中得到一個收斂的最優策略,完成既定的路徑規劃任務,最終得到了一種基于序列模型的海洋環境下的強化學習路徑規劃算法。
聲明:
“基于序列模型的海洋環境下的強化學習路徑規劃算法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)