公開用于訓練和應用機器學習模型來控制機器人裝配的技術。在一些實施方案中,力和扭矩測量值被輸入到機器學習模型中,機器學習模型包括引入遞歸的記憶層。機器學習模型在機器人不可知環境中經由強化學習進行訓練,以在給定力和扭矩測量值的情況下生成用于實現裝配任務的動作。在訓練期間,將經驗收集為情節內的過渡,將過渡分組為序列,并且每個情節的最后兩個序列具有可變重疊。所收集的過渡存儲在經優先級化的序列重放緩沖器中,學習者從經優先級化的序列重放緩沖器中基于過渡和序列優先級對要學習的序列進行采樣。一旦經訓練,機器學習模型就可被部署來基于由各種類型的機器人的傳感器獲取的力和扭矩測量值來控制這些機器人以執行裝配任務。
聲明:
“力和扭矩引導的機器人裝配技術” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)