[發明專利]用戶數據處理方法及裝置有效
| 申請號: | 201710172998.7 | 申請日: | 2017-03-22 |
| 公開(公告)號: | CN108629608B | 公開(公告)日: | 2023-02-24 |
| 發明(設計)人: | 蔡業首;湯煌;張小鵬 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06Q30/0251 | 分類號: | G06Q30/0251;G06Q30/0601;H04L67/55 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 郭曼;王琦 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 數據處理 方法 裝置 | ||
1.一種用戶數據處理方法,其特征在于,包括:
獲取多個用戶分別在指定時間段內對多條信息的訪問記錄,基于所述訪問記錄確定每個用戶的用于表征其是否對信息感興趣的指示值;
針對所述多個用戶中的每個用戶,根據該用戶的歷史訪問數據確定該用戶對應的每個興趣標簽的訪問量統計值,創建包含該用戶的所述指示值和所確定的所述訪問量統計值的一組樣本數據;其中,所述多個用戶對應的各個興趣標簽被劃分到多個信息類目下,每一興趣標簽對應一個信息類目;
構建概率估計模型,其中,所述概率估計模型用于確定一用戶對信息感興趣的概率,所述概率估計模型包括一用戶對應的各興趣標簽的訪問量統計值、每一興趣標簽的權重參數和每一信息類目的權重參數;
基于所述概率估計模型,根據所創建的各組樣本數據確定每一興趣標簽的權重參數和每一信息類目的權重參數;
針對任一用戶對應的任一信息類目,根據該信息類目的權重參數以及該信息類目下該用戶對應的各興趣標簽的權重參數,計算該用戶對該信息類目的興趣值;
所述計算該用戶對該信息類目的興趣值包括:
獲取該用戶對應的在該信息類目下的各興趣標簽的訪問統計值;
根據所獲取的在該信息類目下的各興趣標簽的訪問統計值、在該信息類目下的各興趣標簽的權重參數以及該信息類目的權重參數,計算該用戶對該信息類目的興趣值。
2.根據權利要求1所述的方法,其中,所述根據所創建的各組樣本數據確定每一興趣標簽的權重參數和每一信息類目的權重參數,包括:
基于所述概率估計模型,利用所述各組樣本數據中每個用戶對應的各興趣標簽的訪問量統計值,確定每個用戶對信息感興趣的概率;其中,所確定的每個用戶的所述概率與該用戶對應的各興趣標簽的權重參數及其對應的各信息類目的權重參數相關;
根據所述確定的每個用戶對信息感興趣的概率,計算產生所述多個用戶對應的多個指示值的概率,所確定的所述概率與每一興趣標簽的權重參數和每一信息類目的權重參數相關;
基于最大似然法,使得所述概率取極大值的情況下確定每一興趣標簽的權重參數和每一信息類目的權重參數的取值。
3.根據權利要求2所述的方法,其中,所述使得所述概率取極大值的情況下確定每一興趣標簽的權重參數和每一信息類目的權重參數的取值包括:
對所述每一興趣標簽的權重參數和每一信息類目的權重參數賦初值;
設置學習率λ;
根據迭代公式迭代求解所述每一興趣標簽的權重參數wt和每一信息類目的權重參數wg,直至所述每一興趣標簽的權重參數和每一信息類目的權重參數收斂,其中為產生所述多個用戶對應的多個指示值的概率的對數,其中N為選取的抽樣用戶的個數,yi為第i個用戶的指示值,p代表某個用戶對信息感興趣的概率,WG代表信息類目的權重向量,是一個G維的向量,G為信息類目總數,WT代表興趣標簽的權重向量,是一個T維的向量,T為所有興趣標簽的個數;
將所述收斂的每一興趣標簽的權重參數和每一信息類目的權重參數的取值確定為每一興趣標簽的權重參數和每一信息類目的權重參數的取值。
4.根據權利要求1所述的方法,其特征在于,所述概率估計模型為二分類算法模型。
5.根據權利要求4所述的方法,其特征在于,所述二分類算法模型為以下公式表征的邏輯斯蒂回歸算法模型:
其中p代表一個用戶對信息感興趣的概率,wg代表信息類目g的權重參數,WG代表信息類目的權重向量,是一個G維的向量,G為信息類目總數;t∈wg代表興趣標簽t為信息類目g中的興趣標簽;xt代表興趣標簽t的訪問統計值;wt代表興趣標簽t的權重參數,WT代表所有興趣標簽的權重向量,是一個T維的向量,T為所有興趣標簽的個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710172998.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種互聯網廣告推廣的方法和系統
- 下一篇:匹配終端的方法和裝置





