[發明專利]一種計算樣本數據之間的距離的方法及設備在審
| 申請號: | 201810247666.5 | 申請日: | 2018-03-23 |
| 公開(公告)號: | CN110298679A | 公開(公告)日: | 2019-10-01 |
| 發明(設計)人: | 劉洋;蔣豐澤;趙曉東 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 馮艷蓮 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本數據 度量 客戶 矩陣 矩陣計算 客戶挖掘 設備需要 相似度 申請 | ||
1.一種樣本數據相似性計算方法,其特征在于,包括:
獲取M個種子客戶的樣本數據和N個候選客戶的樣本數據,M、N均為大于2的整數;
在所述N個候選客戶的樣本數據中,選擇出與所述M個種子客戶的樣本數據相似性最低的P個第一樣本數據,P為大于2的整數;
根據所述M個種子客戶的樣本數據和所述P個第一樣本數據,確定度量矩陣;
其中,所述度量矩陣為半正定矩陣,所述度量矩陣中每個元素大于0,所述度量矩陣滿足以下條件:基于所述度量矩陣計算的所述M個種子客戶的樣本數據中所有不同種子客戶的樣本數據之間的距離之和最小,且基于所述度量矩陣計算的所述P個第一樣本數據中所有不同第一樣本數據之間的距離之和大于設定距離閾值;
基于所述度量矩陣,計算所述M個種子客戶的樣本數據和所述N個候選客戶的樣本數據中不同樣本數據之間的距離。
2.如權利要求1所述的方法,其特征在于,基于所述度量矩陣計算的不同樣本數據之間的距離滿足以下公式:
其中,d(x,y)為所述不同樣本數據之間的距離,x為所述不同樣本數據中的一個樣本數據構成的向量,y為所述不同樣本數據中的另一個樣本數據構成的向量,A為所述度量矩陣。
3.如權利要求1或2所述的方法,其特征在于,在所述N個候選客戶的樣本數據中,選擇出與所述M個種子客戶的樣本數據相似性最低的P個第一樣本數據,包括:
計算所述M個種子客戶的樣本數據和所述N個候選客戶的樣本數據中不同樣本數據之間的歐氏距離;
根據計算得到的不同樣本數據之間的歐氏距離,以及預設的客戶挖掘算法,確定所述N個候選客戶的樣本數據中每個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性參數;
根據確定的每個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性參數,在所述N個候選客戶的樣本數據中,選擇所述P個第一樣本數據。
4.如權利要求1-3任一項所述的方法,其特征在于,在計算所述M個種子客戶的樣本數據和所述N個候選客戶的樣本數據中不同樣本數據之間的距離之后,所述方法還包括:
根據計算得到的不同樣本數據之間的距離,以及預設的客戶挖掘算法,確定所述N個候選客戶的樣本數據中每個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性參數;
判斷預設的停止迭代計算的條件是否滿足;
若滿足,則根據確定的每個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性參數,在所述N個候選客戶的樣本數據中,選擇出與所述M個種子客戶的樣本數據相似性最高的Q個第二樣本數據,其中,Q為大于1的整數;
若不滿足,則根據確定的每個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性,在N個候選客戶的樣本數據中,選擇新的P個第一樣本數據;根據所述M個種子客戶的樣本數據和所述新的P個第一樣本數據,確定新的度量矩陣;基于所述新的度量矩陣,重新計算所述M個種子客戶的樣本數據和所述N個候選客戶的樣本數據中不同樣本數據之間的距離;以及根據重新計算得到的不同樣本數據之間的距離,以及所述客戶挖掘算法,確定所述N個候選客戶的樣本數據中每個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性參數,直至所述停止迭代計算的條件滿足。
5.如權利要求4所述的方法,其特征在于,所述停止迭代計算的條件為以下至少一項:
迭代計算的次數達到設定次數;
所述N個候選客戶的樣本數據中至少一個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性參數大于設定第一相似性閾值;
所述N個候選客戶的樣本數據中每個候選客戶的樣本數據與所述M個種子客戶的樣本數據之間的相似性參數大于設定第二相似性閾值。
6.如權利要求3-5任一項所述的方法,其特征在于,所述客戶挖掘算法為密度傳播算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810247666.5/1.html,轉載請聲明來源鉆瓜專利網。





