[發明專利]基于用戶行為特征的選擇聚類初始點的方法及相關設備在審
| 申請號: | 201910515534.0 | 申請日: | 2019-06-14 |
| 公開(公告)號: | CN110413854A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 鄧悅;金戈;徐亮 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 初始點 數據集中 用戶行為特征 最小距離 集合 數據集 聚類 群組 聚類模型 循環迭代 用戶分組 關聯性 分割 申請 保證 | ||
1.一種基于用戶行為特征的選擇聚類初始點的方法,其特征在于,所述方法包括:
獲取待發掘群組的數據集,所述數據集包括多個用戶的行為特征,將一個用戶作為一個點;
從所述數據集中選擇第一初始點;
從所述數據集中選擇第二初始點,所述第二初始點是指所述數據集中距離所述第一初始點最遠的點;
計算所述數據集中每個點與所述第一初始點和所述第二初始點的距離最小的最小距離點集合,所述最小距離點集合包括多個最小距離點;
從所述最小距離點集合中選擇一個最大的最小距離點作為第三初始點,循環迭代得到包括所有初始點的初始點集合;
按照所述初始點集合將所述數據集分割為多個存在關聯性的用戶群組。
2.根據權利要求1所述的方法,其特征在于,所述第一初始點和所述第二初始點均基于歐式距離的最大最小距離算法得到。
3.根據權利要求2所述的方法,其特征在于,所述計算所述數據集中每個點與所述第一初始點和所述第二初始點的距離最小的最小距離點集合,包括:
從所述數據集中選取第一候選點;
分別計算所述第一候選點與所述第一初始點的第一距離,以及計算所述第一候選點與所述第二初始點的第二距離;
記錄所述第一距離和所述第二距離中最小的距離,將所述第一候選點作為一個最小距離點,分別得到所述數據集中每個候選點相對所述第一初始點和所述第二初始點的最小的距離;
將每個候選點作為一個最小距離點,最終得到所述最小距離點集合。
4.根據權利要求2或3所述的方法,其特征在于,所述從所述最小距離點集合中選擇一個最大的最小距離點作為第三初始點,循環迭代得到包括所有初始點的初始點集合,包括:
若所述數據集中還剩余n個點,則計算Pk與所述第一初始點的距離D1k,與所述第二初始點的距離D2k;其中,Pk是指n個點中的任意一個點,k為大于1且小于n的正整數;
將所述Pk與所述第一初始點距離最小且與所述第二初始點距離最小的點記為Dk_min=min(nk1,nk2);
計算出所有的最小距離點na_min,得到所述最小距離點集合,a為大于1且小于n的正整數;
從所述最小距離點集合中選擇第j個點作為第三初始點,依此循環迭代得到所述初始點集合,所述第j個點記為min_nj=max(na_min,k),第j個點是n個點中最大的點。
5.根據權利要求4所述的方法,其特征在于,每個群組中的用戶相互之間的關聯性高于第一關聯性,不同群組之間的用戶之間的關聯性低于第二關聯性或者不同群組之間的用戶之間不存在關聯性。
6.根據權利要求5所述的方法,其特征在于,所述獲取待發掘群組的數據集之后,所述將所述數據集輸入聚類模型之前,所述方法還包括:
設置本次待分群的類別數目M,M為正整數;
所述從所述最小距離點集合中選擇第j個點作為第三初始點,依此循環迭代得到所述初始點集合,包括:
從所述最小距離點集合中選擇第j個點作為第三初始點,直至得到M個初始點后結束循環迭代操作。
7.一種用于選擇聚類初始點的裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取待發掘群組的數據集,所述數據集包括多個用戶的行為特征,將一個用戶作為一個點;
處理模塊,用于從所述數據集中選擇第一初始點;從所述數據集中選擇第二初始點,所述第二初始點是指所述數據集中距離所述第一初始點最遠的點;計算所述數據集中每個點與所述第一初始點和所述第二初始點的距離最小的最小距離點集合,所述最小距離點集合包括多個最小距離點;從所述最小距離點集合中選擇一個最大的最小距離點作為第三初始點,循環迭代得到包括所有初始點的初始點集合;按照所述初始點集合將所述數據集分割為多個存在關聯性的群組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910515534.0/1.html,轉載請聲明來源鉆瓜專利網。





