[發明專利]一種用于更新知識圖譜的數據處理系統有效
| 申請號: | 202111540664.3 | 申請日: | 2021-12-16 |
| 公開(公告)號: | CN114168608B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 傅曉航;張正義;林方;劉羽 | 申請(專利權)人: | 中科雨辰科技有限公司 |
| 主分類號: | G06F16/23 | 分類號: | G06F16/23;G06F16/22;G06F16/36 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 原春香 |
| 地址: | 100093 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 更新 知識 圖譜 數據處理系統 | ||
本發明涉及一種用于更新知識圖譜的數據處理系統,包括數據庫、處理器和存儲有計算機程序的存儲器,當計算機程序被處理器執行時,實現步驟:獲取多個中間字段名,遍歷原始數據集且當所有中間字段名與任一原始數據列表的所有字段名均相等時,以基于預設本體架構,構建成目標知識圖譜;當某一中間字段名與原始數據列表的所有字段名不相等時,從本體字段名列表中獲取第一目標字段名列表和第二目標字段名列表,根據第一目標字段名列表和第二目標字段名列表,構建成目標知識圖譜,本發明當原始數據進行更新時,只需要更新關鍵字段集和本體列表,就能夠更新全部的知識圖譜,優化知識圖譜的更新過程,提高知識圖譜的效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種用于更新知識圖譜的數據處理系統。
背景技術
信息技術發展的時代,知識圖譜(Knowl edge Graph)通常指可揭示實體之間的關系的語義網絡,其基于數據挖掘、信息處理、圖形繪制等手段,利用可視化的圖譜將復雜的知識領域形象地展示出來,可在一定程度上體現知識領域的發展規律。
在現有技術中,基于每一數據的三元組構建成知識圖譜,無法將相同類型實體的采用統一結構進行快速構建,即無法簡化構建知識圖譜過程,影響知識圖譜的構建效率,同時也導致當數據更新時,只能重新構建三元組和知識圖譜,因此,如何簡化構建知識圖譜過程,提高知識圖譜的構建效率成為亟待解決的技術問題。
發明內容
本發明目的在于,提供一種用于更新知識圖譜的數據處理系統,僅需要更新關鍵字段集和本體列表,完成知識圖譜的更新,簡化知識圖譜的更新過程,提高知識圖譜的效率。
本發明一方面提供了一種用于更新知識圖譜的數據處理系統,所述系統包括:數據庫、處理器和存儲有計算機程序的存儲器,其中,所述第一數據庫中存儲原始數據集和負樣本列表,當所述計算機程序被處理器執行時,實現以下步驟:
S101、獲取目標數據列表且根據所述目標數據列表中所有字段名作為中間字段名,構建成中間字段列表P=(P1,P2,P3,……,Pm),Pt是指第t個中間字段名,t=2……m,m為中間字段名數量;
S103、獲取原始數據集Q=(Q1,Q2,Q3,……,QN),其中,Qz是指第z個原始數據列表,z=1……N,并遍歷Q且當每一Pt與Q中任一Qz的所有字段名均相等時,以基于預設本體架構,構建成目標知識圖譜;
S105、當某一Pt與Q中任一Qz的所有字段名不相等時,基于P和負樣本列表,從所述本體字段名列表中獲取第一目標字段名列表和第二目標字段名列表,其中,所述第一目標字段名列表為基于除Pt之前的其他中間字段名構建的列表,所述第二目標字段名列表為基于Pt構建的字段名列表;
S107、根據所述第一目標字段名列表以第一本體架構,得到第一目標三元組列表且根據所述第二目標字段名列表以第二本體架構,得到第二目標三元組列表,以根據第一目標三元組列表和第二目標三元組列表,構建成目標知識圖譜。
本發明與現有技術相比具有明顯的優點和有益效果。借由上述技術方案,本發明提供的一種用于更新知識圖譜的數據處理系統可達到相當的技術進步性及實用性,并具有產業上的廣泛利用價值,其至少具有下列優點:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科雨辰科技有限公司,未經中科雨辰科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111540664.3/2.html,轉載請聲明來源鉆瓜專利網。





