[發明專利]一種知識圖譜構建方法及裝置、存儲介質和計算設備在審
| 申請號: | 202110947950.5 | 申請日: | 2021-08-18 |
| 公開(公告)號: | CN113849658A | 公開(公告)日: | 2021-12-28 |
| 發明(設計)人: | 呂洪燕;吳國平;張秀杰;劉電;莫春榮 | 申請(專利權)人: | 廣州國交潤萬交通信息有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/33;G06K9/62;G06N3/04 |
| 代理公司: | 廣州藍晟專利代理事務所(普通合伙) 44452 | 代理人: | 陳栩東 |
| 地址: | 510000 廣東省廣州市天河區棠下*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 構建 方法 裝置 存儲 介質 計算 設備 | ||
1.一種知識圖譜構建方法,其特征在于,包括如下步驟:
S1、獲取語料數據;
S2、將語料數據輸入預訓練模型,利用預訓練模型生成語料數據對應的向量表示;
S3、將步驟S2生成的向量分別輸入到LSTM網絡和GRU網絡,以提取語料特征,提取出的語料特征再通過Softmax多分類算法來進行實體抽取和實體關系分類;
S4、將步驟S3抽取出的實體以及實體間的關系存儲到ElasticSearch數據庫中,之后再從ElasticSearch數據庫中搜索查找出所需的實體、實體間的關系,并進一步做編輯修改操作。
2.根據權利要求1所述的知識圖譜構建方法,其特征在于,步驟S2生成的向量存儲在Mysql中,編輯后的實體以及實體間的關系鏈存儲在nebula graph圖形數據庫中。
3.根據權利要求1所述的知識圖譜構建方法,其特征在于,從現有語料庫、純文本文件、HTML、XML、社區論壇爬取語料數據。
4.根據權利要求1所述的知識圖譜構建方法,其特征在于,預訓練模型采用RoBERTa預訓練模型。
5.根據權利要求1所述的知識圖譜構建方法,其特征在于,在步驟S3中,Softmax多分類算法將LSTM網絡和GRU網絡輸出的語料特征均映射到(0,1)區間內,從而得到各語料特征所對應的概率,選出其中的最大概率,該最大概率所對應的實體或實體關系即作為抽取結果。
6.一種知識圖譜構建裝置,其特征在于,包括依次連接的語料數據獲取模塊、向量表示模塊、實體抽取及實體關系分類模塊、存儲及編輯模塊,其中,
語料數據獲取模塊,用于獲取語料數據;
向量表示模塊,用于將語料數據獲取模塊獲取到的語料數據輸入預訓練模型,由預訓練模型生成語料數據對應的向量表示;
實體抽取及實體關系分類模塊,用于將向量表示模塊生成的向量分別輸入到LSTM網絡和GRU網絡來提取語料特征,提取出的語料特征再通過Softmax多分類算法來進行實體抽取和實體關系分類;
存儲及編輯模塊,用于將抽取出的實體以及實體間的關系存儲到ElasticSearch數據庫中,之后再從ElasticSearc數據庫中搜索查找出所需的實體、實體間的關系并進行編輯修改。
7.一種計算機可讀存儲介質,存儲有程序,其特征在于,所述程序被處理器執行時,實現權利要求1至5中任一項所述的知識圖譜構建方法。
8.一種計算設備,包括處理器以及用于存儲處理器可執行程序的存儲器,其特征在于,所述處理器執行存儲器存儲的程序時,實現權利要求1至5中任一項所述的知識圖譜構建方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州國交潤萬交通信息有限公司,未經廣州國交潤萬交通信息有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110947950.5/1.html,轉載請聲明來源鉆瓜專利網。





