本申請是對話信息獲取方法、裝置、設備及存儲介質,涉及人工智能技術領域。所述方法包括:獲取第一對話信息;基于第一對話信息,通過第一對話模型進行數據處理,獲得第二對話信息;基于第一對話信息以及第二對話信息,通過第一判別器進行數據處理,獲得第一置信分數;基于第一置信分數,對第一對話模型進行參數更新。上述方案,訓練好的判別器可以對輸入第一對話模型的第一對話信息,以及第一對話模型輸出的第二對話信息之間的匹配度進行檢測,并將匹配分數作為獎勵值,且每一輪對話都可以獲得該輪對話對應的獎勵值,提高了獎勵值產生的密度,從而提高了通過強化學習訓練得到的第一對話模型的訓練效率。
聲明:
“對話信息獲取方法、裝置、設備及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)