[發明專利]用戶標簽生成方法及裝置有效
| 申請號: | 201610454113.8 | 申請日: | 2016-06-21 |
| 公開(公告)號: | CN107526741B | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 熊安斌;張鋒;張旭 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 羅振安 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 標簽 生成 方法 裝置 | ||
1.一種用戶標簽生成方法,其特征在于,所述方法包括:
對于同種的用戶設備中記錄了用戶數據的每個客戶端,分別從所述客戶端所具有的特征屬性中,獲取與預設的n種特征屬性相同的至少一種特征屬性,所述用戶數據用于反映使用所述客戶端的用戶對所述客戶端所執行的操作,所述特征屬性用于反映所述客戶端的目標用戶群體共同具備的特征,所述n為正整數;
根據每個客戶端所具有的特征屬性的數量,確定每個客戶端所具有的至少一種特征屬性中每種特征屬性的權重信息,得到所述n種特征屬性中每種特征屬性的權重信息;利用預設的聚類指標k和每種特征屬性的權重信息對所述同種的用戶設備中記錄了用戶數據的所有客戶端進行聚類,得到k個類別,每個類別包括至少一個客戶端和每個客戶端所屬的用戶設備,所述k為正整數;
從所述k個類別中提取至少一個特征客戶端,所述特征客戶端用于反映所述用戶設備的目標用戶群體的共同興趣;根據每個客戶端記錄的用戶數據生成第一用戶標簽,并根據所述至少一個特征客戶端生成第二用戶標簽;
所述從所述k個類別中提取至少一個特征客戶端之后,還包括:
當所述至少一個特征客戶端的數量為r時,獲取每個特征客戶端的標識,將r個客戶端中每個客戶端的標識作為一種特征屬性,得到n+r種特征屬性,所述r為正整數;
將n更新為n+r,觸發執行所述根據每個客戶端所具有的特征屬性的數量,確定每個客戶端所具有的至少一種特征屬性中每種特征屬性的權重信息,得到所述n種特征屬性中每種特征屬性的權重信息;利用預設的聚類指標k和每種特征屬性的權重信息對所述同種的用戶設備中記錄了用戶數據的所有客戶端進行聚類,得到k個類別,從所述k個類別中提取至少一個特征客戶端的步驟,直到提取所述特征客戶端失敗時停止。
2.根據權利要求1所述的方法,其特征在于,每個客戶端的用戶數據包括所述客戶端的運行頻率,所述根據所述客戶端所具有的特征屬性的數量,確定所述客戶端具有的至少一種特征屬性中每種特征屬性的權重信息,得到所述n種特征屬性中每種特征屬性的權重信息,包括:
根據預設的權重總分和每個客戶端所具有的特征屬性的數量,設置每個客戶端所具有的每種特征屬性的權重,所述權重與所述客戶端所具有的特征屬性的數量呈負相關關系;
根據每個客戶端的運行頻率和每個客戶端所具有的每種特征屬性的權重,確定每個客戶端所具有的每種特征屬性的權重信息;
對于每個用戶設備中記錄了用戶數據的所有客戶端,將同種特征屬性的權重信息相加,得到所述n種特征屬性的權重信息。
3.根據權利要求1所述的方法,其特征在于,每個客戶端的用戶數據包括所述客戶端的運行頻率和運行時間段,所述根據每個客戶端所具有的特征屬性的數量,確定每個客戶端所具有的至少一種特征屬性中每種特征屬性的權重信息,得到所述n種特征屬性中每種特征屬性的權重信息,包括:
根據預設的權重總分和每個客戶端所具有的特征屬性的數量,設置每個客戶端所具有的每種特征屬性的權重,所述權重與所述客戶端所具有的特征屬性的數量呈負相關關系;
確定每個客戶端的運行時間段所屬的預設時間段,并確定每個客戶端在對應的預設時間段內的運行頻率,每個預設時間段對應所述n種特征屬性;
對于每個客戶端,根據所述客戶端在每個預設時間段內的運行頻率和所述客戶端所具有的每種特征屬性的權重,確定所述客戶端在每個預設時間段對應的每種特征屬性的權重信息;
對于每個用戶設備中記錄了用戶數據的所有客戶端,將同一預設時間段內的同種特征屬性的權重信息相加,得到每個預設時間段對應的所述n種特征屬性的權重信息。
4.根據權利要求2或3所述的方法,其特征在于,所述利用預設的聚類指標k和每種特征屬性的權重信息對所述同種的用戶設備中記錄了用戶數據的所有客戶端進行聚類,得到k個類別,包括:
當所述同種的用戶設備包括m個用戶設備時,根據所述n種特征屬性的權重信息生成m×p維的特征矩陣,當所述用戶數據不包括每個客戶端的運行時間段時,p=n;當所述用戶數據包括每個客戶端的運行時間段,且預設時間段的數量為q時,p=n×q;
對所述特征矩陣進行歸一化處理,得到m×p維的歸一化矩陣;
利用所述聚類指標k對所述歸一化矩陣進行聚類,得到所述k個類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610454113.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種展現搜索結果的方法及電子設備
- 下一篇:用于處理多語言文本的方法和設備





