本發明提供了一種模型壓縮方法、系統、終端及存儲介質,該方法包括:對待壓縮模型進行模型訓練,在待壓縮模型中添加正則項和奇異值分解,得到奇異值矩陣,根據奇異值矩陣返回執行對待壓縮模型進行模型訓練的步驟及后續步驟,直至待壓縮模型滿足性能下降條件,輸出待壓縮模型;根據待壓縮模型的權重張量進行參數聚類,得到權重參數矩陣,對權重參數矩陣進行權值量化,得到聚類量化矩陣;根據聚類量化矩陣對待壓縮模型進行參數設置,得到壓縮模型。本發明基于稀疏正則化、迭代剪枝和聚類量化的聯合模型壓縮方式,從全局的角度上對待壓縮模型進行模型壓縮,在保障精度不減的前提下,實現了最大化的模型壓縮。
聲明:
“模型壓縮方法、系統、終端及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)