本發明涉及知識圖譜技術領域,提供了一種基于語言統計模型的地質領域文獻圖譜生成方法。其旨在發現同類信息(這里是地質學金礦領域內信息)之間的關聯性,構建的圖譜創新點在于金礦領域內的知識,采用文獻進行構建。其主要方案包括:分詞操作,進行詞性過濾操作,得到僅剩下名詞、動詞、介詞的主干句子,對主干句子進行動詞過濾操作,得到不以人為主語的及物動詞的句子。對上一步的結果進行關系二元組抽取操作,并計算概率每一個關系二元組均有一個概率p。將相同的關系詞拼接,根據概率p計算組成的關系三元組的概率P。對關系三元組進行關系詞過濾及概率排序操作得到關系三元組列表,對關系三元組進行圖譜生成。
聲明:
“基于語言統計模型的地質領域文獻圖譜生成方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)