[發(fā)明專利]實體融合方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910860139.6 | 申請日: | 2019-09-11 |
| 公開(公告)號: | CN110580294B | 公開(公告)日: | 2022-11-29 |
| 發(fā)明(設(shè)計)人: | 王策;杜東 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06K9/62 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 崔曉嵐;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 實體 融合 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
1.一種實體融合方法,其特征在于,所述方法包括:
從至少一個知識圖譜中,獲取樣本數(shù)據(jù);
當(dāng)所述樣本數(shù)據(jù)對應(yīng)于兩個以上的知識圖譜時,從目標(biāo)知識圖譜中的樣本數(shù)據(jù)的實體中,確定待提取的目標(biāo)實體;其中,所述目標(biāo)知識圖譜為所述兩個以上的知識圖譜中的任一知識圖譜;
對目標(biāo)知識圖譜中的樣本數(shù)據(jù)中的實體進行特征提取,得到對應(yīng)所述目標(biāo)實體的目標(biāo)向量;
對其他知識圖譜中的實體進行特征提取,得到所述其他知識圖譜中實體對應(yīng)的子向量,所述其他知識圖譜為,所述至少一個知識圖譜中所述目標(biāo)知識圖譜之外的知識圖譜;
從所述子向量中,選擇對應(yīng)負樣本實體的負樣本向量;
其中,所述負樣本實體為,所述其他知識圖譜中出現(xiàn)頻次大于頻次閾值,且與所述目標(biāo)實體無關(guān)聯(lián)關(guān)系的實體;
基于所述負樣本向量,確定每一所述子向量與所述目標(biāo)向量相同的概率信息,并將所述概率信息滿足條件的子向量,確定為與所述目標(biāo)向量相同的候選向量;
將所述候選向量對應(yīng)的候選實體,與所述目標(biāo)實體進行融合。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述樣本數(shù)據(jù)對應(yīng)于同一個知識圖譜時,所述樣本數(shù)據(jù)中除所述目標(biāo)實體之外的其他實體中不包含與所述目標(biāo)實體相同的實體。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述候選向量對應(yīng)的候選實體,與所述目標(biāo)實體進行融合,包括:
將所述與所述目標(biāo)實體相同的候選向量對應(yīng)的候選實體,和所述目標(biāo)實體進行對齊,以實現(xiàn)候選實體與所述目標(biāo)實體的融合。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述將所述候選向量對應(yīng)的候選實體,與所述目標(biāo)實體進行融合之前,所述方法還包括:
針對同一個知識圖譜中樣本數(shù)據(jù)的目標(biāo)向量和其他向量,確定每一其他向量與所述目標(biāo)向量之間的關(guān)聯(lián)度;其中,所述其他向量包括:所述目標(biāo)知識圖譜中除所述目標(biāo)實體之外的實體對應(yīng)的向量;
將關(guān)聯(lián)度大于等于關(guān)聯(lián)度閾值的其他向量,確定為與所述目標(biāo)向量相匹配的候選向量。
5.一種實體融合裝置,其特征在于,所述裝置包括:
第一確定模塊,用于從至少一個知識圖譜中,獲取樣本數(shù)據(jù);當(dāng)所述樣本數(shù)據(jù)對應(yīng)于兩個以上的知識圖譜時,從目標(biāo)知識圖譜中的樣本數(shù)據(jù)的實體中,確定待提取的目標(biāo)實體;其中,所述目標(biāo)知識圖譜為所述兩個以上的知識圖譜中的任一知識圖譜;
第一提取模塊,用于對目標(biāo)知識圖譜中的樣本數(shù)據(jù)中的實體進行特征提取,得到對應(yīng)所述目標(biāo)實體的目標(biāo)向量;對其他知識圖譜中的實體進行特征提取,得到所述其他知識圖譜中實體對應(yīng)的子向量,所述其他知識圖譜為,所述至少一個知識圖譜中所述目標(biāo)知識圖譜之外的知識圖譜;
第一查找模塊,用于從所述子向量中,選擇對應(yīng)負樣本實體的負樣本向量;其中,所述負樣本實體為,所述其他知識圖譜中出現(xiàn)頻次大于頻次閾值,且與所述目標(biāo)實體無關(guān)聯(lián)關(guān)系的實體;基于所述負樣本向量,確定每一所述子向量與所述目標(biāo)向量相同的概率信息,并將所述概率信息滿足條件的子向量,確定為與所述目標(biāo)向量相同的候選向量;
第一融合模塊,用于將所述候選向量對應(yīng)的候選實體,與所述目標(biāo)實體進行融合。
6.一種實體融合的設(shè)備,其特征在于,包括:
存儲器,用于存儲可執(zhí)行指令;
處理器,用于執(zhí)行所述存儲器中存儲的可執(zhí)行指令時,實現(xiàn)權(quán)利要求1至4任一項所述的方法。
7.一種存儲介質(zhì),其特征在于,存儲有可執(zhí)行指令,用于引起處理器執(zhí)行時,實現(xiàn)權(quán)利要求1至4任一項所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910860139.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:實體關(guān)系的存儲方法及裝置
- 下一篇:交通工具娛樂系統(tǒng)





