本發明提供了基于強化學習的對話式導診方法,包括:利用用戶編碼模塊記錄用戶在t時刻的輸入xt,并通過卷積神經網絡學習到用戶輸入的編碼ut;通過循環神經網絡,基于編碼ut及上一時刻系統的隱藏狀態ht?1,得到核心網絡模塊的輸出ot及當前的隱藏狀態ht,在分類預測模塊,輸出ot通過全連接的前向網絡,輸出分類評定ct;在提問策略模塊,基于輸出ot,通過全連接的前向網絡得到預定義命名實體識NER類別上的概率分布qt,基于累計的NER記錄表和提問模板,進行交互對話,在達到預定的T輪交互后,退出交互,并以最后一次ct的結果作為最終的科室推薦結果。本發明可及時調整系統狀態,向用戶提供可靠的科室推薦結果,并保存收集到用戶關鍵信息,供下游應用調用。
聲明:
“基于強化學習的對話式導診方法、裝置及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)