本發明提供的基于匹配學習的多標簽分類學習方法,首先對客戶端數據進行特征值計算,得到訓練集;設定訓練集中的正負標簽;然后計算訓練集中特征集合的嵌入式表征E;計算正標簽的嵌入式表征Z+和負標簽的嵌入式表征Z?;接著對E和Z+作損失計算,對E與Z?作損失計算;依據正負損失值,采用梯度下降算法對訓練集進行模型訓練;當訓練模型的損失值不再下降時,訓練結束,否則再次訓練;最后采用測試集測試該訓練模型。本發明考慮了長尾標簽對傳統極大規模多標簽分類模型學習的不利影響,提出利用特征集合和標簽集合的匹配學習方法。此外,為保證模型能夠擴展到大規模數據集上,采用梯度下降算法的模型學習方式,既可保證模型并行化學習,還可支持模型在線增量學習。
聲明:
“基于匹配學習的多標簽分類學習方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)