本發明涉及視頻監控技術,具體涉及一種目標跟蹤的方法。本發明主要是基于強化學習算法實現一種單目標跟蹤方案,將每個目標的每個跟蹤作為策略問題對待。通過跟蹤的狀態(reward)來優化控制策略(policy),進而對深度學習網絡進行訓練。本發明結合Siamese網絡結構和RL方案,相較于一般的RL方案直接基于扣取圖像進行目標預測,使用目標模板與圖像進行相關特征進行預測,能夠使用目標的周邊信息,提高目標的語義背景區分能力,提高跟蹤的魯棒性。本發明本發明同時使用DQN進行跟蹤,對價值函數的估計及策略的優化沒有解藕,容易訓練不收斂或者過擬合。
聲明:
“目標跟蹤的方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)