本發明公開了一種基于高斯強化學習的信號源遍歷方法。首先離散化任務環境,并在離散化的環境中,確定每一個方格的中心位置;然后,根據當前檢測到的信號強度信息和歷史檢測到的信號強度信息,采用高斯過程方法預測區域內每一個方格中心位置的信號強度信息,并將該信號強度信息作為強化學習中對應的獎勵函數;根據獎勵函數,計算每一個方格的狀態值函數,并依據狀態值函數,采用滾動優化思想,得到最優方格序列,并將第一個方格作為四旋翼無人機下一步的目標位置;開發了預測控制方法,能夠根據目標位置,控制四旋翼無人機沿著光滑的軌跡到達目標位置,最后完成信號源遍歷任務。本發明采用的方法可以有效提高信號源遍歷速度,縮短飛行路徑。
聲明:
“基于高斯強化學習的信號源遍歷方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)