[發明專利]網絡業務用戶群組劃分的方法和裝置有效
| 申請號: | 201410307390.7 | 申請日: | 2014-06-30 |
| 公開(公告)號: | CN105281925B | 公開(公告)日: | 2019-05-14 |
| 發明(設計)人: | 楊向勇;艾志兵;劉黎春;陳川 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | H04L12/18 | 分類號: | H04L12/18;H04L12/24 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 蔣雅潔;張穎玲 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 業務 用戶 劃分 方法 裝置 | ||
1.一種網絡業務用戶群組劃分的方法,其特征在于,包括步驟:
獲取多個用戶在當前統計周期內的屬性和/或行為數據,每個用戶的屬性和/或行為數據包括多個統計指標,并將所述屬性和/或行為數據轉換為標準化數據;
根據所述標準化數據,確定多個群組中心點,將所述標準化數據劃分到距離最近的群組中心點所在群組;
對所述各個群組中的標準化數據的差異性進行分析,確定各個群組的群組特征;
根據各個群組的群組特征,分別向各個群組的用戶推送對應群組特征的業務推送信息。
2.如權利要求1所述的網絡業務用戶群組劃分的方法,其特征在于,所述對所述各個群組中的標準化數據的差異性進行分析,確定各個群組的群組特征的步驟包括:
根據所述各個群組中的標準化數據,分別計算各個群組中各個統計指標的偏差概率,比較各個群組中同一個統計指標的偏差概率大小,獲取所述統計指標的偏差概率較其他群組差異最顯著的群組,將所述統計指標的數值特征作為該群組的群組特征。
3.如權利要求2所述的網絡業務用戶群組劃分的方法,其特征在于,所述屬性和/或行為數據包括:
U1=(X11,X21,……,Xj1,……,Xm1);
U2=(X12,X22,……,Xj2,……,Xm2);
……;
Ui=(X1i,X2i,……,Xji,……,Xmi);
……;
Un=(X1n,X2n,……,Xjn,……,Xmn);
其中,i為用戶的序號,n為獲取的用戶總個數,Ui為第i個用戶的屬性和/或行為數據,j為屬性和/或行為數據的統計指標的序號,m為屬性和/或行為數據的統計指標的總個數,Xj為第j個統計指標的屬性和/或行為數據,Xji為第i個用戶的第j個統計指標的屬性和/或行為數據。
4.如權利要求3所述的網絡業務用戶群組劃分的方法,其特征在于,當所述屬性和/或行為數據為連續型數據時,所述將屬性和/或行為數據轉換為標準化數據采用以下公式:
Xji標準=(Xji-Xjmin)÷(Xjmax-Xjmin);
Ui標準=(X1i標準,X2i標準,……,Xji標準,……,Xmi標準);
其中,Xji標準為Xji轉換后的標準化數據,Xjmax為當前統計周期內第j個統計指標的所有屬性和/或行為數據中數值最大的屬性和/或行為數據,Xjmin為當前統計周期內第j個統計指標的所有屬性和/或行為數據中數值最小的屬性和/或行為數據。
5.如權利要求3所述的網絡業務用戶群組劃分的方法,其特征在于,當所述屬性和/或行為數據為分類型數據時,所述將屬性和/或行為數據轉換為標準化數據采用以下步驟:
對同一個統計指標中屬性和/或行為數據的取值進行分類,相同的取值分為一類,分類后的取值包括Y1、Y2、……、Ye、……、Yf,其中f為取值分類總個數,e為取值的分類序號,Ye為第e類取值;
判斷f是否小于或等于2;
當f小于或等于2時,判斷Y1和Y2是否僅為0或1;
如果是,則無需數值轉換,原屬性和/或行為數據作為標準化數據Xji;
如果否,則將Y1轉換為0、Y2轉換為1,或將Y1轉換為1、Y2轉換為0,將轉換后的數據作為標準化數據Xji;
當f大于2時,若所述屬性和/或行為數據的取值為Ye,則使Ye對應的取值為1、除Ye之外的取值為0,按照Y1、Y2、……、Ye、……、Yf的排列順序,將所述屬性和/或行為數據的取值轉換為f位的二值型數據,并將轉換后的二值型數據乘以獲得標準化數據Xji標準。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410307390.7/1.html,轉載請聲明來源鉆瓜專利網。





