本發明提供一種用于進行使用了機器人的缺陷檢查的機器學習裝置、機器人控制系統以及機器學習方法。機器學習裝置具有:狀態信息取得部,其從機器人控制檢查系統取得包含缺陷檢測信息、機器人機械手的移動路徑和工件的拍攝點、照相機的拍攝次數在內的狀態信息s,機器人控制檢查系統使機器人機械手把持工件或者照相機來進行工件的缺陷檢查,缺陷檢測信息包含工件的缺陷檢測部位;行為信息輸出部,其輸出狀態s的調整信息即行為a;回報計算部,其根據包含缺陷檢測部位的缺陷檢測信息,計算強化學習中的回報值;價值函數更新部,其根據由回報計算部計算出的回報值、狀態s、行為a來進行強化學習,由此更新行為價值函數Q。
聲明:
“機器學習裝置、機器人控制系統和機器學習方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)