[發明專利]用戶分群處理方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201711027618.7 | 申請日: | 2017-10-27 |
| 公開(公告)號: | CN110019759A | 公開(公告)日: | 2019-07-16 |
| 發明(設計)人: | 唐紅艷;趙銘;范欣;張偉 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/958 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶標識 計算機設備 存儲介質 信息標識 用戶分群 主題分布 主題模型 群體 分群 文檔 單詞 記錄 申請 | ||
1.一種用戶分群處理方法,所述方法包括:
獲取與訓練集中的各用戶標識對應的記錄所點擊的信息標識的點擊序列;
將所述點擊序列和所述點擊序列中的信息標識分別作為主題模型中的文檔和單詞,進行主題模型訓練,得到各所述點擊序列相應的主題分布;
分別按照各所述點擊序列相應的主題分布,確定各所述點擊序列相應用戶標識的群體分布;
對各所述用戶標識分別按照相應的群體分布確定所屬的群體。
2.根據權利要求1所述的方法,其特征在于,還包括:
獲取用戶信息集;
將用戶信息集劃分為訓練集和推測集;
根據由所述訓練集訓練得到的主題模型的參數以及所述推測集,訓練所述推測集對應的主題模型;
根據所述推測集對應的主題模型確定所述推測集中用戶標識所屬的群體。
3.根據權利要求2所述的方法,其特征在于,所述獲取用戶信息集包括:
獲取候選的各用戶標識對應的已點擊的信息標識;
獲取候選的各用戶標識對應的記錄對應于信息標識的操作行為記錄;
從獲取的信息標識中,根據所述操作行為記錄過濾掉無效點擊的信息標識;
根據候選的各用戶標識對應的過濾后剩余的信息標識,生成相應點擊序列;
根據所述點擊序列和相應用戶標識得到用戶信息集。
4.根據權利要求3所述的方法,其特征在于,所述從獲取的信息標識中,根據所述操作行為記錄過濾掉無效點擊的信息標識包括:
獲取所述操作行為記錄中對應于獲取的所述信息標識的操作行為數據;
在獲取的操作行為數據中篩選符合無效點擊判斷條件的操作行為數據;
從獲取的信息標識中,將篩選出的操作行為數據所對應的信息標識過濾掉。
5.根據權利要求2所述的方法,其特征在于,所述獲取用戶信息集包括:
獲取候選的各用戶標識對應的已點擊的信息標識;
從獲取的信息標識中,過濾屬于熱門信息類和/或冷門信息類的信息標識;
根據候選的各用戶標識對應的過濾后剩余的信息標識,生成相應點擊序列;
根據所述點擊序列和相應用戶標識得到用戶信息集。
6.根據權利要求5所述的方法,其特征在于,還包括:
查詢獲取的信息標識各自對應的點擊次數或點擊頻率;
將對應的點擊次數或點擊頻率大于等于高頻點擊閾值的信息標識歸類到熱門信息類;
將對應的點擊次數或點擊頻率小于等于低頻點擊閾值的信息標識歸類到冷門信息類。
7.根據權利要求2所述的方法,其特征在于,所述主題模型的參數為所述訓練集經過訓練得到的主題與信息標識的概率分布;
所述根據由所述訓練集訓練得到的主題模型的參數以及所述推測集,訓練所述推測集對應的主題模型包括:
獲取與推測集中的各用戶標識對應的點擊序列;
根據所述主題與信息標識的概率分布,并將所述推測集中的各用戶標識對應的點擊序列和所述點擊序列中的信息標識分別作為主題模型中的文檔和單詞,進行主題模型訓練。
8.根據權利要求1所述的方法,其特征在于,所述對各所述用戶標識分別按照相應的群體分布確定所屬的群體包括:
確定各所述用戶標識在相應群體分布中所對應的各群體的分布概率;
從與所述用戶標識對應的群體中,按照相應分布概率由大到小的順序篩選預設數量的群體,作為相應用戶標識所屬的群體。
9.根據權利要求8所述的方法,其特征在于,所述從與所述用戶標識對應的群體中,按照相應分布概率由大到小的順序篩選預設數量的群體,作為相應用戶標識所屬的群體包括:
將各所述用戶標識所對應各群體的分布概率分別與分群置信度閾值比較;
在與各所述用戶標識對應的群體中,分別將相應分布概率低于所述分群置信度閾值的群體過濾掉;
從過濾后剩余的群體中,按照相應分布概率由大到小的順序,選取預設數量的群體作為相應用戶標識所屬的群體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711027618.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種核心要素提取方法、裝置及電子設備
- 下一篇:一種文本信息的處理方法及系統





