本申請提供了一種基于深度強化學習的機器人自主尋源方法及裝置。所述方法包括:建立放射源計數衰減模型和放射源計數分布模型;基于實際環境,建立尋源模擬環境,所述尋源模擬環境包括探測器、放射源和屏蔽物;基于所述放射源計數衰減模型和放射源計數分布模型,利用所述探測器在所述尋源模擬環境中沿著不同路徑測量不同位置的所述放射源的放射性活度,并依據價值函數,確定探測器在每個狀態下,不同動作對應的價值函數值,多次訓練后以建立深度強化學習模型;基于所述深度強化學習模型,在實際環境中找到放射源。
聲明:
“基于深度強化學習的機器人自主尋源方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)