[發(fā)明專利]實體推薦方法及裝置、終端及可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201711326740.4 | 申請日: | 2017-12-13 |
| 公開(公告)號: | CN108509479B | 公開(公告)日: | 2022-02-11 |
| 發(fā)明(設計)人: | 李瀟;鄭孫聰 | 申請(專利權(quán))人: | 深圳市騰訊計算機系統(tǒng)有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/35;G06F16/36;G06K9/62 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 蔣雅潔;張穎玲 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 推薦 方法 裝置 終端 可讀 存儲 介質(zhì) | ||
1.一種實體推薦方法,其特征在于,所述方法包括:
獲取輸入的實體標簽,基于所述實體標簽確定目標實體;
基于所述目標實體查找預置的知識圖譜包含的實體關系,得到所述目標實體的候選實體集合,所述候選實體集合中包含候選實體,及所述候選實體的關系特征向量;
將所述候選實體集合中的候選實體與預置的黑名單包含的實體進行匹配,確定匹配的實體;
從所述候選實體集合中刪除所述匹配的實體及所述匹配的實體的特征向量,以更新所述候選實體集合;
基于指定來源語料庫的實體共現(xiàn)數(shù)據(jù)集合,對更新后的所述候選實體集合中包含的候選實體進行相似度計算,得到所述候選實體的相似度特征向量;其中,所述實體共現(xiàn)數(shù)據(jù)集合中包含具有共現(xiàn)關系的實體之間的共現(xiàn)次數(shù);
根據(jù)所述候選實體集合中各候選實體的關系特征向量及相似度特征向量,得到所述目標實體的相關實體,推薦所述相關實體。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述候選實體包含一階實體及上位詞實體,所述實體關系特征向量包含一階關系特征向量及上位詞特征向量;
則所述基于所述目標實體查找預置的知識圖譜包含的實體關系,得到所述目標實體的候選實體集合,包括:
在所述知識圖譜包含的實體關系中,查找與所述目標實體具有一階關系的一階實體,得到所述目標實體的一階實體及所述一階實體的一階關系特征向量;
在所述知識圖譜包含的實體關系中,查找與所述目標實體具有上位詞關系的上位實體,得到所述目標實體的上位實體集合;
確定在所述知識圖譜中,上位詞集合與所述目標實體的上位詞集合的上位詞特征向量大于第一閾值的上位詞實體。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述候選實體還包括二階實體,所述實體關系特征向量還包括二階關系特征向量;
則所述基于所述目標實體查找預置的知識圖譜包含的實體關系,得到所述目標實體的候選實體集合,還包括:
在所述知識圖譜包含的實體關系中,查找與所述一階實體具有一階關系的實體,將查找到的實體作為所述目標實體的二階實體,并得到所述二階實體的二階關系特征向量。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述目標實體查找預置的知識圖譜包含的實體關系,得到所述目標實體的候選實體集合,之后還包括:
基于預置的第一詞向量模型,計算所述第一詞向量模型中各實體與所述目標實體的第一召回相似度特征向量,所述第一詞向量模型為利用word2vec對預置時間段內(nèi)的新聞數(shù)據(jù)訓練得到的;其中,所述第一召回相似度特征向量為新聞實體余弦cosine相似度特征向量;
將所述第一詞向量模型中,第一召回相似度特征向量大于第二閾值的實體作為第一召回實體,并基于所述知識圖譜包含的實體關系,確定所述第一召回實體的關系特征向量;
將所述第一召回實體、所述第一召回實體的第一召回相似度特征向量及所述關系特征向量添加至所述候選實體集合中。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述目標實體查找預置的知識圖譜包含的實體關系,得到所述目標實體的候選實體集合,之后還包括:
基于預置的第二詞向量模型,計算所述第二詞向量模型中各實體與目標向量的第二召回相似度特征向量;所述第二詞向量模型為利用 word2vec 對百科數(shù)據(jù)訓練得到的;其中,所述第二召回相似度特征向量為百科實體余弦cosine相似度特征向量;
將所述第二詞向量模型中,第二召回相似度特征向量大于第三閾值的實體作為第二召回實體,并基于所述知識圖譜包含的實體關系,確定所述第二召回實體的關系特征向量;
將所述第二召回實體、所述第二召回實體的第二召回相似度特征向量及實體特征向量添加至所述候選實體集合中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市騰訊計算機系統(tǒng)有限公司,未經(jīng)深圳市騰訊計算機系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711326740.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





