[發明專利]近鄰向量的召回方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010003861.0 | 申請日: | 2020-01-03 |
| 公開(公告)號: | CN111209953A | 公開(公告)日: | 2020-05-29 |
| 發明(設計)人: | 洪立濤 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/9535 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 近鄰 向量 召回 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種近鄰向量的召回方法,其特征在于,所述方法包括:
獲取源向量和目標向量集的聚類結果,所述聚類結果包括至少兩個類別的聚類向量集,以及所述聚類向量集的質心向量;
根據所述源向量和所述聚類向量集的所述質心向量之間的第一相似度,從所述聚類向量集中確定出所述源向量的至少一個近鄰向量集;
根據所述源向量和所述近鄰向量集中的各個候選近鄰向量之間的第二相似度,從所述候選近鄰向量中召回目標近鄰向量。
2.根據權利要求1所述的方法,其特征在于,所述按照所述第一相似度由高到低的順序,從所述聚類向量集中確定出所述源向量的至少一個近鄰向量集,包括:
計算所述源向量和所述聚類向量集的所述質心向量之間的第一相似度;
按照所述第一相似度由高到低的順序,將排序在前n個的聚類向量集確定為所述源向量的n個近鄰向量集,n為正整數。
3.根據權利要求2所述的方法,其特征在于,所述聚類結果還包括:所述聚類向量集中的目標向量的個數;
所述按照所述第一相似度由高到低的順序,將排序在前n個聚類向量集確定為所述源向量的至少一個近鄰向量集,包括:
按照所述第一相似度由高到低的順序,將排序在第n個的聚類向量集添加至所述源向量的近鄰向量集,n的起始值為1;
計算前i個聚類向量集中的目標向量的個數總和;
響應于所述個數總和小于所述目標召回數量,令n等于n+1,再次執行所述將排序在第i個的聚類向量集添加至所述源向量的近鄰向量集中的步驟;
響應于所述個數總和大于或等于所述目標召回數量,得到所述源向量的n個近鄰向量集。
4.根據權利要求1至3任一所述的方法,其特征在于,所述根據所述源向量和所述近鄰向量集中的各個近鄰向量之間的第二相似度,從所述近鄰向量中召回目標近鄰向量,包括:
計算至少兩個所述近鄰向量集相對于所述源向量之間的相似度分布;
按照所述相似度分布將至少兩個所述近鄰向量集劃分為m個組,不同組對應不同的相似度分布分段;
將所述m個組分配至并列的m個計算節點中進行排序,所述排序包括根據所述源向量和所述近鄰向量集中的各個近鄰向量之間的第二相似度對所述近鄰向量進行排序;
將所述m個計算節點的排序結果按照所述相似度分布分段進行拼接,得到全局排序結果;
將所述全局排序結果中的前q個近鄰向量,召回為所述源向量的目標近鄰向量。
5.根據權利要求4所述的方法,其特征在于,所述計算至少兩個所述近鄰向量集相對于所述源向量之間的相似度分布,包括:
采樣所述近鄰向量集中的一部分近鄰向量,確定為樣本近鄰向量;
根據所述源向量和所述樣本近鄰向量之間的相似度,計算得到所述源向量和所述近鄰向量集之間的第三相似度;
根據至少兩個所述近鄰向量集的所述第三相似度,得到至少兩個所述近鄰向量集相對于所述源向量之間的相似度分布。
6.根據權利要求5所述的方法,其特征在于,所述按照所述相似度分布將至少兩個所述近鄰向量集劃分為m個組,包括:
按照所述相似度分布中的所述第三相似度由高到低的順序,將至少兩個所述近鄰向量集劃分為m個組;
或,
按照所述相似度分布中的所述第三相似度由低到高的順序,將至少兩個所述近鄰向量集劃分為m個組。
7.根據權利要求1至6任一所述的方法,其特征在于,所述方法還包括:
獲取聚類類別的個數k;
按照所述個數k對所述目標向量集進行聚類,得到所述k個類別的聚類向量集;
確定所述聚類向量集的質心向量。
8.根據權利要求1至6任一所述的方法,其特征在于,
所述源向量是第一用戶向量,所述目標向量集中的目標向量是第二用戶向量;
或,
所述源向量是用戶向量,所述目標向量集中的目標向量是物品向量或信息向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010003861.0/1.html,轉載請聲明來源鉆瓜專利網。





