本發明提供了一種基于主動強化學習的裝備目標識別方法及人機智能體,通過獲取目標單元的時間態勢,并進行特征向量編碼,輸入神經網絡模型進行訓練,在每個時間點模型自動推斷是否需要引入人類經驗指導進行學習訓練,并得到每個目標單元在各時間步的目標預測結果及一個時間片段的目標分類結果,最后根據獎賞值對網絡模型進行更新。本發明通過將人類經驗指導引入機器的目標分類學習中,根據訓練數據的模型輸出結果自動推斷出如何識別目標類別,經實驗驗證,在引入人類經驗指導的模型訓練后,可以實現更精確的目標分類,大大減少了人力消耗。
聲明:
“基于主動強化學習的裝備目標識別方法及人機智能體” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)