用于使用機器學習模型的方法、系統和裝置,包括編碼在計算機存儲介質上的計算機程序,所述機器學習模型已經通過強化學習被訓練為選擇內容項。其中一種所述方法包括:接收表征第一場境的第一數據,在所述第一場境中,可以在呈現環境中將第一內容項呈現給第一用戶;以及將所述第一數據作為輸入提供給長期參與機器學習模型,所述模型已經通過強化學習被訓練為:接收多個輸入,并且處理所述多個輸入中的每個輸入以生成每個輸入的相應參與分值,所述相應參與分值表示如果在所述相應場境中呈現了所述相應內容項則在所述呈現環境中向所述相應用戶呈現的未來內容項的所述相應用戶進行的預測的、根據時間調節的總選擇數。
聲明:
“使用強化學習來選擇內容項” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)