本發明公開了一種基于語言模型和強化學習的關鍵詞問答方法,包括以下步驟:(1)用關鍵詞問題句和自然語言問題句的混合數據集來訓練一個關鍵詞問題分類器;(2)在自然語言問題句的數據集上預訓練一個語言模型;(3)將步驟(2)中的語言模型高層網絡提取,并用關鍵詞問題句和其對應的自然語言問題句來訓練一個含語言模型網絡的問題重構模型來重構由步驟(1)判斷為關鍵詞問題句的問題;(4)將重構的問題句送入一個訓練好的問答模型中,得到答案;(5)利用強化學習,以步驟(4)中預測答案和標準答案的相似度作為獎勵函數來優化步驟(3)中的重構模型。利用本發明,可以大大提升了在大規模數據集上關鍵詞問答任務的準確率。
聲明:
“基于語言模型和強化學習的關鍵詞問答方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)