[發明專利]一種利用路徑排序快速進行知識圖譜補全的方法在審
| 申請號: | 202111554206.5 | 申請日: | 2021-12-17 |
| 公開(公告)號: | CN114398349A | 公開(公告)日: | 2022-04-26 |
| 發明(設計)人: | 莊連生;龍嘯;李厚強 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/28;G06F16/22 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 金怡 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 路徑 排序 快速 進行 知識 圖譜 方法 | ||
1.一種利用路徑排序快速進行知識圖譜補全的方法,其特征在于,包括如下步驟:
步驟1、數據構建階段,對知識圖譜進行數據清洗和預處理;
步驟2、離線階段,為知識庫中的三元組生成元路徑特征;利用訓練模塊對訓練知識庫中三元組及其元路徑特征進行訓練,訓練好相應的分類器;
步驟3、在線階段,利用生成好的元路徑特征完成鏈接預測的任務。
2.根據權利要求1所述的一種利用路徑排序快速進行知識圖譜補全的方法,其特征在于,所述步驟1中,數據構建階段,對知識圖譜進行數據清洗和預處理,具體為:
知識圖譜構建流程如下:知識獲取及存儲,首先從不同來源、不同結構的數據中獲取知識,爬取好這些數據后,根據這些知識已有的邏輯關系,對其進行三元組的構建,并連成圖數據的結構;然后對圖譜中的三元組進行統計,統計圖譜中實體和關系的數量并編號;表示為如下形式:實體1:EID1,實體2:EID2,…,實體n:EIDn;關系1:RID1,關系2:RID2,…,關系n:RIDn,將圖譜中的三元組進行量化,形成(EIDi,RIDj,EIDk)的范式,完成了補全圖譜的數據預處理過程。
3.根據權利要求1所述的一種利用路徑排序快速進行知識圖譜補全的方法,其特征在于,所述步驟2,離線階段,為知識庫中的三元組生成元路徑特征,具體為:
步驟FS1,利用路徑提取模塊提取知識庫中每個關系對應的元路徑集合;
步驟FS2,利用路徑向量化模塊將所有訓練三元組中對應的元路徑集合進行編碼,生成對應的元路徑特征,并進行存儲;
步驟FS3,利用訓練模塊對訓練知識庫中三元組及其元路徑特征進行訓練,訓練好相應的分類器。
4.根據權利要求1所述的一種利用路徑排序快速進行知識圖譜補全的方法,其特征在于,所述步驟3在線階段,利用生成好的元路徑特征完成鏈接預測的任務,具體為:
步驟OS1,針對缺失信息的三元組,將其缺失的實體進行擴充,生成候選三元組集合;
步驟OS2,對每個候選的三元組查詢對應的元路徑特征,并利用訓練好的分類器進行打分,選出Top-K個實體作為發明的補全結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111554206.5/1.html,轉載請聲明來源鉆瓜專利網。





