本發明實施例提供一種語言模型建立方法及裝置。所述方法包括獲取語料庫,語料庫包括至少一個經過分詞處理的句子;根據策略函數對所述語料庫中的每個句子進行篩選,將滿足預設篩選條件的句子組成分詞詞典;通過對分詞詞典中每個句子的分析得到語言模型;用語言模型對預先獲取的聲學模型進行解碼以計算損失函數;若根據損失函數和預設的獎勵函數得到的獎勵值滿足預設的優化條件,則判斷所述語言模型建立完成,本發明實施例通過策略函數對獲取的語料庫進行篩選,然后將得到語言模型對聲學模型進行解碼得到CTC函數,再通過得到的獎勵函數對策略函數進行優化改進,從而通過強化學習的方法快速得到需要的語言模型,且能夠提高語音識別的準確率。
聲明:
“語言模型建立方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)