本發明提供一種用于航空領域的知識元抽取方法,具體實施步驟包括:將航空領域的結構化標注數據輸入到Bert模型,輸出結構化標注數據的特征向量;將輸出的特征向量和Word2Vec模型學習到的特征向量進行融合,并做Concat疊加步驟;將得到的字向量輸入到層次歸一化層,得到標準化的字向量;利用高層強化學習過程對得到的每個字向量進行解碼,按句識別字向量中的關系觸發詞;建立面向航空領域長實體的頭尾指針模型,得到預測出的關系和尾實體起止位置序列;將預測出的實體輸出后,根據實體的標簽信息進行就近原則以及匹配方式進行匹配。本發明面向航空領域,基于鄭碼、五筆、拼音和筆畫等特征融入的方式,與Bert輸出的向量相結合,提升了準確率與召回率。
聲明:
“用于航空領域的知識元抽取方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)