[發明專利]向量索引建立方法及裝置和向量檢索方法及裝置有效
| 申請號: | 201811058763.6 | 申請日: | 2018-09-11 |
| 公開(公告)號: | CN110889424B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 趙康;潘攀;任小楓 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F18/23 | 分類號: | G06F18/23;G06F16/2455 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 李丹;栗若木 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量 索引 建立 方法 裝置 檢索 | ||
1.一種向量索引建立方法,包括:
根據N個二值特征和預設第一數值,獲取預設第一數值個第一聚類中心,其中,N為大于或等于億級的數值,預設第一數值為百萬級數值;
根據所述預設第一數值個第一聚類中心對應的二值特征和預設第二數值,獲取預設第二數值個第二聚類簇;
對獲取的每個第二聚類簇,根據第二聚類簇包括的二值特征對應的維度更新該第二聚類簇的聚類中心;
利用更新后的聚類中心和預設第一數值個第一聚類中心對應的二值特征進行聚類迭代直到滿足迭代結束條件,得到預設第二數值個第二聚類中心;
分別計算所述預設第一數值個第一聚類中心和得到的預設第二數值個第二聚類中心的海明距離,使得所述預設第一數值個第一聚類中心對應的二值特征同時歸屬于距離自身最近的K個第二聚類中心,以更新所述獲取的預設第二數值個第二聚類簇;其中,K為大于或等于2的整數;其中,一個第一聚類中心歸屬于兩個以上第二聚類中心所在聚類簇;
根據獲取的預設第一數值個第一聚類中心建立第一索引,根據獲取的預設第二數值個第二聚類中心建立第二索引。
2.根據權利要求1所述的向量索引建立方法,其中,所述根據N個二值特征和預設第一數值,獲取預設第一數值個第一聚類中心,包括:
根據所述N個二值特征和所述預設第一數值,獲取預設第一數值個第一聚類簇;
對獲取的每個第一聚類簇,根據第一聚類簇包括的二值特征對應的維度更新該第一聚類簇的聚類中心;
利用更新后的聚類中心和所述N個二值特征進行聚類迭代直到滿足迭代結束條件,得到所述預設第一數值個第一聚類中心。
3.根據權利要求2所述的向量索引建立方法,其中,所述利用更新后的聚類中心和N個二值特征進行聚類迭代直到滿足迭代結束條件,包括:
以所述更新后得到的聚類中心替換上一次聚類中心,返回所述根據N個二值特征和預設第一數值,獲取所述預設第一數值個第一聚類簇的步驟。
4.根據權利要求2或3所述的向量索引建立方法,其中,所述根據所述N個二值特征和所述預設第一數值,獲取預設第一數值個第一聚類簇,包括:
從所述N個二值特征中采樣所述預設第一數值個二值特征作為初始的第一聚類中心;
分別計算所述N個二值特征和初始的第一聚類中心的海明距離,使得所述N個二值特征分別歸屬于距離自身最近的第一聚類中心,以形成所述預設第一數值個第一聚類簇。
5.根據權利要求2或3所述的向量索引建立方法,其中,所述對獲取的每個第一聚類簇,根據第一聚類簇包括的二值特征對應的維度更新該第一聚類簇的聚類中心,包括:
將所述第一聚類簇中的二值特征對應維度累加;
計算累加值與該第一聚類簇包括的二值特征的個數的商,將得到的商二值化并作為更新后的該第一聚類簇的聚類中心。
6.根據權利要求1所述的向量索引建立方法,其中,所述利用更新后的聚類中心和預設第一數值個第一聚類中心對應的二值特征進行聚類迭代直到滿足迭代結束條件,包括:
以更新后得到的聚類中心替換上一次聚類中心,返回所述根據所述預設第一數值個第一聚類中心對應的二值特征和所述預設第二數值,獲取預設第二數值個第二聚類簇的步驟。
7.根據權利要求1或6所述的向量索引建立方法,其中,所述根據所述預設第一數值個第一聚類中心對應的二值特征和所述預設第二數值,獲取預設第二數值個第二聚類簇,包括:
從所述預設第一數值個第一聚類中心對應的二值特征中采樣所述預設第二數值個二值特征作為初始的第二聚類中心;
分別計算所述預設第一數值個第一聚類中心對應的二值特征和初始的第二聚類中心的海明距離,使得所述預設第一數值個第一聚類中心對應的二值特征分別歸屬于距離自身最近的第二聚類中心,以形成所述預設第二數值個第二聚類簇。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811058763.6/1.html,轉載請聲明來源鉆瓜專利網。





