[發明專利]知識圖譜更新方法、裝置及電子設備有效
| 申請號: | 202010201639.1 | 申請日: | 2020-03-20 |
| 公開(公告)號: | CN111444181B | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 王策 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/23;G06F16/27 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 葉虹 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 更新 方法 裝置 電子設備 | ||
本公開提供了知識圖譜更新方法、裝置,涉及人工智能領域。該方法包括:響應于知識圖譜更新請求,調用第一服務獲取消息隊列中的第一標識信息,根據第一標識信息獲取HBASE數據庫中與第一標識信息對應的網絡資源,并對網絡資源進行知識抽取以獲取三元組信息;調用第二服務對三元組信息與原始三元組信息進行融合,以獲取融合三元組信息;調用第三服務對融合三元組信息中的屬性和屬性值進行處理以獲取中間三元組信息,并根據中間三元組信息中的實體信息進行信息融合以獲取目標三元組信息;調用第四服務對目標三元組信息進行處理,以獲取更新后的知識圖譜,并將更新后的知識圖譜寫入HBASE數據庫中。本公開能夠提高知識圖譜的更新效率,保證知識更新的實時性。
技術領域
本公開涉及人工智能技術領域,具體而言,涉及一種知識圖譜更新方法、知識圖譜更新裝置、計算機存儲介質及電子設備。
背景技術
知識圖譜(Knowledge Graph)是人工智能重要分支知識工程在大數據環境中的成功應用,知識圖譜與大數據和深度學習一起,成為推動互聯網和人工智能發展的核心驅動力之一。知識圖譜是結構化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關系。其基本組成單位是“實體關系實體”三元組,以及實體及其相關屬性-值對,實體間通過關系相互聯結,構成網狀的知識結構。
通常采用分布式文件系統(HDFS,Hadoop Distributed File System)存儲知識圖譜,在根據非結構化文本抽取得到三元組結構的知識,并基于三元組結構的知識構建知識圖譜的過程中,所有的數據處理模塊都是通過腳本串行運行,中間結果都存儲在HDFS中。但是由于基于HDFS的知識圖譜構建架構中有十余個數據處理模塊,各個數據處理模塊都通過腳本串行運行,運行一次完整的流程需要一天甚至好幾天的時間,這樣一來,對于變化比較快的實體,其信息無法及時更新到知識圖譜中,實時性較差。同時HDFS的存儲結構決定了無法根據key對單條數據進行修改。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的實施例提供了一種知識圖譜更新方法、知識圖譜更新裝置、計算機存儲介質及電子設備,進而至少在一定程度上可以提高數據處理效率,實時更新知識圖譜中的知識。
本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開的實踐而習得。
根據本公開實施例的一個方面,提供了一種知識圖譜更新方法,所述方法包括:響應于知識圖譜更新請求,調用第一服務獲取消息隊列中的第一標識信息,根據所述第一標識信息獲取HBASE數據庫中與所述第一標識信息對應的網絡資源,并對所述網絡資源進行知識抽取以獲取三元組信息;調用第二服務對所述三元組信息與原始三元組信息進行融合,以獲取融合三元組信息;調用第三服務對所述融合三元組信息中的屬性和屬性值進行處理以獲取中間三元組信息,并根據所述中間三元組信息中的實體信息進行信息融合以獲取目標三元組信息;調用第四服務對所述目標三元組信息進行處理,以獲取更新后的知識圖譜,并將所述更新后的知識圖譜寫入所述HBASE數據庫中。
根據本公開實施例的一個方面,提供了一種知識圖譜更新裝置,所述裝置包括:信息抽取模塊,用于響應于知識圖譜更新請求,調用第一服務獲取消息隊列中的第一標識信息,根據所述第一標識信息獲取HBASE數據庫中與所述第一標識信息對應的網絡資源,并對所述網絡資源進行信息抽取以獲取三元組信息;信息融合模塊,用于調用第二服務對所述三元組信息與原始三元組信息進行融合,以獲取融合三元組信息;第一處理模塊,用于調用第三服務對所述融合三元組信息中的屬性和屬性值進行處理以獲取中間三元組信息,并根據所述中間三元組信息中的實體信息進行信息融合以獲取目標三元組信息;第二處理模塊,用于調用第四服務對所述目標三元組信息進行處理,以獲取更新后的知識圖譜,并將所述更新后的知識圖譜寫入所述HBASE數據庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010201639.1/2.html,轉載請聲明來源鉆瓜專利網。





