本發明提供一種對話推薦方法,裝置、電子設備及介質,采用歷史序列提升推薦效率,方法包括:獲取用戶與項目之間的歷史交互序列,并將歷史交互序列輸入至包含嵌入層、自注意塊及預測層的推薦網絡模型中進行訓練,生成項目偏好值;其中,項目包含項目屬性;利用項目偏好值及用戶未交互過的項目生成候選項目集;當接收到用戶發送的偏好項目屬性時,利用偏好項目屬性更新候選項目集,并利用項目相關值計算更新后的候選項目集中各候選項目的交互預測值;利用交互預測值及候選項目生成候選屬性集,并利用交互預測值計算候選屬性集中各候選項目屬性的偏好預測值;將完成計算后的候選項目集及候選屬性集輸入策略網絡中進行強化學習,向用戶進行對話推薦。
聲明:
“對話推薦方法、裝置、電子設備及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)