[發明專利]實體融合方法、裝置、設備及存儲介質有效
| 申請號: | 201910860139.6 | 申請日: | 2019-09-11 |
| 公開(公告)號: | CN110580294B | 公開(公告)日: | 2022-11-29 |
| 發明(設計)人: | 王策;杜東 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 崔曉嵐;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 融合 方法 裝置 設備 存儲 介質 | ||
本發明實施例提供了一種實體融合方法、裝置、設備及存儲介質;所述方法包括:確定待提取的目標實體;采用人工智能的特征提取模型,對樣本數據中的實體進行特征提取,得到所述目標實體的目標向量和其他實體的其他向量;從所述其他向量中,查找與所述目標向量相匹配的候選向量;將所述候選向量對應的候選實體,與所述目標實體進行融合。通過樣本數據中的實體向量,確定與目標實體匹配的實體,從而提高相似實體融合的準確率。
技術領域
本發明涉及機器學習領域,尤其涉及實體融合方法、裝置、設備及存儲介質。
背景技術
在相關技術中,知識圖譜中實體融合的方法是,每個類型的實體定義一些關鍵屬性,計算這些屬性的相似度,對每個屬性相似度加權求和,大于某個閾值則認為兩個實體相似,將該兩個實體進行融合;但是實體關鍵屬性值存在噪音,每個來源的知識圖譜實體信息準確度不能保證,導致無法融合。
發明內容
本發明實施例提供一種實體融合方法、裝置、設備及存儲介質,能夠通過樣本數據中的實體向量,確定與目標實體匹配的實體,從而提高相似實體融合的準確率。
本發明實施例的技術方案是這樣實現的:
第一方面,本發明實施例提供一種實體融合方法,包括:
確定待提取的目標實體;
對樣本數據中的實體進行特征提取,得到所述目標實體的目標向量和其他實體的其他向量;
從所述其他向量中,查找與所述目標向量相匹配的候選向量;
將所述候選向量對應的候選實體,與所述目標實體進行融合。
第二方面,本發明實施例提供一種實體融合裝置,包括:
第一確定模塊,用于確定待提取的目標實體;
第一提取模塊,用于對樣本數據中的實體進行特征提取,得到所述目標實體的目標向量和其他實體的其他向量;
第一查找模塊,用于從所述其他向量中,查找與所述目標向量相匹配的候選向量;
第一融合模塊,用于將所述候選向量對應的候選實體,與所述目標實體進行融合。
第三方面,本發明實施例提供一種實體融合的設備,包括:
存儲器,用于存儲可執行指令;
處理器,用于執行所述存儲器中存儲的可執行指令時,實現上述實體融合方法。
第四方面,本發明實施例提供一種存儲介質,存儲有可執行指令,用于引起處理器執行時,實現本發明實施例提供的實體融合方法。
本發明實施例具有以下有益效果:首先,確定待提取的目標實體;然后,采用人工智能的特征提取模型,對樣本數據中的實體進行特征提取,得到所述目標實體的目標向量和其他實體的其他向量;從所述其他向量中,查找與所述目標向量相匹配的候選向量;最后,將所述候選向量對應的候選實體,與所述目標實體進行融合;如此,通過對樣本數據進行特征提取,得到目標實體和其他實體的向量,然后,從其他向量中查找與目標向量匹配的候選向量,最后將目標實體和候選實體進行融合,提高了識別候選實體的準確度,從而提高了將不同來源的相似實體融合的準確率。
附圖說明
圖1是本發明實施例提供的實體融合系統的一個可選的架構示意圖;
圖2是本發明實施例提供的實體融合的系統的結構示意圖;
圖3是本發明實施例提供的實體融合方法的實現流程示意圖;
圖4A是本發明實施例提供的實體融合方法的另一實現流程示意圖;
圖4B是本發明實施例提供的實體融合方法的另一實現流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910860139.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:實體關系的存儲方法及裝置
- 下一篇:交通工具娛樂系統





