本公開提供了一種基于自學習對話模型的人機對話方法及系統;所述方案利用預定義的角色信息訓練一個角色信息記憶網絡,預測回復時首先利用角色信息記憶網絡生成與當前語境相關程度最高的角色信息,并將角色信息輸入到對話生成網絡中;通過適當地融入角色信息更符合用戶之間的對話習慣,使模型生成的回復更加具有個性和多樣性;同時,本公開所述方案將基于馬爾可夫決策過程的強化學習方式融入模型的學習過程中,對模型的參數進行微調和優化,利用對話生成的模型初始化兩個學習體,讓它們進行多輪的對話探索;隨著學習體的探索,每個學習體的角色信息記憶選擇網絡會完善對對方的印象描述,一組成功的對話可以讓對話雙方通過對話的內容和對話者的特點增強對對方的了解。
聲明:
“基于自學習對話模型的人機對話方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)