本申請提供的基于強化學習的檢測模型訓練方法及相關裝置中,模型訓練設備利用強化學習的思想,基于當前構建策略為多個初始模型構建不同的損失函數,用于訓練出多個候選模型;然后,從多個候選模型中確定出訓練效果最好的作為目標模型;并根據目標模型對病灶的識別精度更新構建策略;以及將目標模型復制多份作為下一輪迭代周期的多個初始模型。如此,經過至少一輪的迭代,獲得滿足預設條件的病灶檢測模型。因此,在以上訓練過程中,自動最優地選擇損失函數,從而能夠避免人為選擇損失函數所引入的主觀影響,從而在一定程度上提升所訓練病灶檢測模型的泛化能力。
聲明:
“基于強化學習的檢測模型訓練方法及相關裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)