本發明公開了一種空間精細操作的多任務強化學習基準平臺設計方法,屬于空間技術領域。本發明方法包括:搭建多任務空間操作的訓練環境,構建多模態觀測信息的提取基準,建立多任務空間操作學習的評價基準,將干擾變量總數、干擾變量攝動方差、接觸動力學攝動方差等引入策略優化,可更好應對空間環境的多源干擾與非結構化特點。針對真實環境數據采樣的高成本、低安全問題,本發明實現了機器人設置與真實環境相近的虛擬環境,利用虛擬環境數據采樣代替真實環境數據采樣,有利于提升算法的可復用性。
聲明:
“空間精細操作的多任務強化學習基準平臺設計方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)