本發明涉及一種基于強化學習的無人艇混合感知自主避障方法及系統,該方法包括以下步驟:1)搭建海洋環境;2)根據無人艇推進器情況設置動作空間,根據靜態海圖提供的全局規劃信息與雷達系統探測半徑范圍內的障礙物信息學習得到強化學習狀態編碼;3)設置獎勵目標權重,獲得綜合獎勵函數;4)搭建并訓練評價網絡與策略網絡;5)將強化學習狀態編碼分別輸入至評價網絡與策略網絡,將綜合獎勵函數輸入至評價網絡,根據學習到的策略網絡的均值對應的動作,決定控制器的輸出。與現有技術相比,本發明具有高度自我學習的能力,可以經過簡單的部署訓練適應不同大規模復雜環境,進而實現自主感知、自主導航、自主避障。
聲明:
“基于強化學習的無人艇混合感知自主避障方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)