[發明專利]一種對用戶標記標簽的方法和裝置有效
| 申請號: | 202010260060.2 | 申請日: | 2020-04-03 |
| 公開(公告)號: | CN113554041B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 劉洋;黃倩 | 申請(專利權)人: | 北京京東振世信息技術有限公司 |
| 主分類號: | G06F18/23 | 分類號: | G06F18/23;G06Q30/01 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 張一軍;王安娜 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 標記 標簽 方法 裝置 | ||
1.一種對用戶標記標簽的方法,其特征在于,包括:
根據屬性值的大小,將各個用戶劃分為多個類別;
分別計算各個所述類別對應的屬性值質心和畫像特征質心;
基于各個所述畫像特征質心,對屬性值在任意兩個相鄰的屬性值質心之間的各個用戶進行聚類;
根據聚類結果將所述屬性值劃分為多個標記區間,基于各個所述標記區間對目標用戶標記標簽;
基于各個所述畫像特征質心,對屬性值在任意兩個相鄰的屬性值質心之間的各個用戶進行聚類,包括:
基于各個所述畫像特征質心,對屬性值在任意兩個相鄰的屬性值質心之間的各個用戶進行聚類,從而確定任意兩個相鄰的所述屬性值質心之間的屬性分割點;
根據各個所述屬性分割點,重新將所述各個用戶劃分為多個類別;
對于任意兩個相鄰的屬性值質心,采用如下方法確定所述兩個相鄰的屬性值質心之間的屬性分割點:
在兩個相鄰的第一屬性值質心與第二屬性值質心之間確定屬性分割點,使得:屬性值在所述第一屬性值質心與所述屬性分割點之間的用戶的特征向量到所述第一屬性值質心對應的第一畫像特征質心的距離,以及,屬性值在所述屬性分割點與所述第二屬性值質心之間的用戶的特征向量到所述第二屬性值質心對應的第二畫像特征質心的距離,之和最小。
2.根據權利要求1所述的方法,其特征在于,根據屬性值的大小,將各個用戶劃分為多個類別,包括:
按照屬性值由小到大的順序,對各個用戶進行排序;
將屬性值劃分為N個區間,根據所述各個用戶的屬性值將所述各個用戶匹配至對應的區間,從而將所述各個用戶劃分為N個類別;其中,N為正整數。
3.根據權利要求1所述的方法,其特征在于,對于每個類別,采用如下方法計算所述類別對應的屬性值質心和畫像特征質心:
從所述類別中各個用戶的屬性值中篩選出中位數,將所述中位數作為所述類別的屬性值質心;
計算所述類別中各個用戶的特征向量的平均值,將所述平均值作為所述類別的畫像特征質心。
4.根據權利要求3所述的方法,其特征在于,計算所述類別中各個用戶的特征向量的平均值,將所述平均值作為所述類別的畫像特征質心,包括:
對于特征向量中的每個特征維度,計算所述類別中各個用戶的特征向量中所述特征維度對應的平均值,從而得到各個特征維度對應的平均值;
基于所述各個特征維度對應的平均值,構建所述類別的畫像特征質心。
5.根據權利要求1所述的方法,其特征在于,根據各個所述屬性分割點,重新將所述各個用戶劃分為多個類別,包括:
將屬性值在任意兩個相鄰的屬性分割點之間的用戶聚為一簇,從而重新將所述各個用戶劃分為多個類別。
6.根據權利要求5所述的方法,其特征在于,根據聚類結果將所述屬性值劃分為多個標記區間,包括:
將任意兩個相鄰的屬性分割點分別作為一個標記區間的最小值和最大值,從而將所述屬性值劃分為多個標記區間;其中,每個標記區間對應于一個標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東振世信息技術有限公司,未經北京京東振世信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010260060.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:研磨速率的修正方法
- 下一篇:立體式天線射頻前端裝置





