[發明專利]一種用于更新知識圖譜的數據處理系統有效
| 申請號: | 202111540664.3 | 申請日: | 2021-12-16 |
| 公開(公告)號: | CN114168608B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 傅曉航;張正義;林方;劉羽 | 申請(專利權)人: | 中科雨辰科技有限公司 |
| 主分類號: | G06F16/23 | 分類號: | G06F16/23;G06F16/22;G06F16/36 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 原春香 |
| 地址: | 100093 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 更新 知識 圖譜 數據處理系統 | ||
1.一種用于更新知識圖譜的數據處理系統,其特征在于,所述系統包括:數據庫、處理器和存儲有計算機程序的存儲器,其中,所述數據庫中存儲原始數據集合和負樣本列表,當所述計算機程序被處理器執行時,實現以下步驟:
S101、獲取目標數據列表且將所述目標數據列表中所有字段名作為中間字段名,構建成中間字段列表P=(P1,P2,P3,……,Pm),Pt是指第t個中間字段名,t=2……m,m為中間字段名數量;
S103、獲取原始數據集Q=(Q1,Q2,Q3,……,QN),其中,Qz是指第z個原始數據列表,z=1……N,并遍歷Q且當每一Pt與Q中任一Qz的所有字段名均相等時,以基于預設本體架構,構建成目標知識圖譜;其中,在S103步驟中,獲取Qz中所有原始字段名且根據任一所述原始字段名,從本體字段名列表中獲取所述原始字段名對應的關聯數據和從A中獲取原始字段名的第一記錄和第二記錄,以建立預設本體架構;S105、當某一Pt與Q中任一Qz的所有字段名不相等時,基于P和負樣本列表,從本體字段名列表中獲取第一目標字段名列表和第二目標字段名列表,其中,所述第一目標字段名列表為基于除Pt之前的其他中間字段名構建的列表,所述第二目標字段名列表為基于Pt構建的字段名列表;
S107、根據所述第一目標字段名列表以第一本體架構,得到第一目標三元組列表且根據所述第二目標字段名列表以第二本體架構,得到第二目標三元組列表,以根據第一目標三元組列表和第二目標三元組列表,構建成目標知識圖譜;
其中,當原始數據進行更新時,更新關鍵字段集和本體列表以更新全部的知識圖譜。
2.根據權利要求1所述的用于更新知識圖譜的數據處理系統,其特征在于,所述目標數據列表是在原始數據集中增加的原始數據列表。
3.根據權利要求1所述的用于更新知識圖譜的數據處理系統,其特征在于,還通過如下步驟確定本體字段列表:
基于所述字段名字列表中任一字段進行預處理,得到目標關鍵列表A0;
基于A0,確定出M個關鍵字段列表,以根據A0和M個關鍵字段列表,構建成關鍵字段集A=(A0,A1,A2,……,AM),Ai是第i個關鍵字段列表且Ai中包括第一關鍵字段和第二關鍵字段,i=1……M;
基于每一Ai的第一關鍵字段和第二關鍵字段,從所述字段名列表中刪除Ai的第一關鍵字段和Ai的第二關鍵字段,構建成本體字段名列表,其中,所述第一關鍵字段與所述第二關鍵字段之間存在關聯關系。
4.根據權利要求3所述的用于更新知識圖譜的數據處理系統,其特征在于,還通過如下步驟確定字段名列表:
基于每一所述原始數據列表中所有原始字段名和負樣本列表,獲取字段名列表,所述字段名列表包括第一字段和第二字段,其中,所述第一字段與所述第二字段之間具有關聯關系。
5.根據權利要求4所述的用于更新知識圖譜的數據處理系統,其特征在于,所述原始字段名為在原始數據表中每一字段對應的字段名。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科雨辰科技有限公司,未經中科雨辰科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111540664.3/1.html,轉載請聲明來源鉆瓜專利網。





