本發明提供一種基于強化學習的機器人多目標搜索路徑規劃方法和裝置。方法包括:對機器人進行目標搜索的地圖信息和狀態信息進行初始化;指示機器人按照第一搜索模式開始目標搜索,并同時啟動搜索計時;第一搜索模式包括規則搜索模式、隨機搜索模式;判斷機器人是否在其當前探測范圍區域搜索到目標;若為否,則指示機器人繼續按照第一搜索模式執行目標搜索;若為是,則指示機器人按照第二搜索模式執行目標搜索;第二搜索模式為:先根據機器人的環境狀態,基于強化學習算法獲得機器人的狀態?動作對的評價值,再根據獲得的機器人的狀態?動作對的評價值確定機器人執行的下一個動作。本發明提供的技術方案可以有效提高機器人對多目標搜索的速度和精度。
聲明:
“基于強化學習的機器人多目標搜索路徑規劃方法和裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)