[發明專利]獲取用戶畫像的方法、裝置、服務器及存儲介質有效
| 申請號: | 201910645998.3 | 申請日: | 2016-04-29 |
| 公開(公告)號: | CN110378731B | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 魯夢平 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;賈允 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 獲取 用戶 畫像 方法 裝置 服務器 存儲 介質 | ||
本發明公開了一種獲取用戶畫像的方法、裝置、服務器及存儲介質,屬于信息處理技術領域。所述方法包括:根據用戶行為日志,獲取M個訓練樣本;根據訓練樣本,采用數據擬合模型修正初始化的用戶參數矩陣Wm×k和標簽參數矩陣Hk×n,得到最終的用戶參數矩陣Wm×k和最終的標簽參數矩陣Hk×n;根據最終的用戶參數矩陣Wm×k和最終的標簽參數矩陣Hk×n,獲取用戶畫像矩陣Pm×n。本發明通過將用戶和標簽參數化,并采用數據擬合模型修正用戶參數矩陣和標簽參數矩陣,使之擬合訓練樣本,無需人工為標簽設定相應的標簽權重,根據用戶行為日志采用數據擬合方法自動地獲取用戶畫像,達到了節省時間和人力成本,準確高效地獲取用戶畫像的技術效果。
本發明是針對申請號為201610284124.6,申請日為2016.04.29,發明名稱為獲取用戶畫像的方法及裝置的分案申請。
技術領域
本發明實施例涉及信息處理技術領域,特別涉及一種獲取用戶畫像的方法、裝置、服務器及存儲介質。
背景技術
用戶畫像,又稱用戶角色(Persona),是一種用于勾畫目標用戶、聯系用戶訴求與設計方向的有效工具,其在各領域得到了廣泛的應用。具體實現時,可將用戶畫像以用于刻畫用戶特征的標簽(tag)集合表示,該標簽集合可包括從用戶社會屬性、生活習慣、消費行為等角度刻畫用戶特征的標簽。比如年齡、性別、地域、學歷和用戶偏好等標簽。
現有技術提供了一種獲取用戶畫像的方法。預先設定多個標簽,并人工為每一個標簽設定相應的標簽權重,標簽權重可以根據實際應用的需求或人工經驗預先設定。可選的,對于每一個標簽,根據具備該標簽的物品在所有物品中的占比,設定該標簽對應的標簽權重。通常,上述占比與標簽權重呈負相關關系,也即上述占比越大則標簽權重越小,上述占比越小則標簽權重越大。而后獲取用戶行為日志,用戶行為日志記錄有用戶對各個物品執行的各種行為,比如:用戶1瀏覽了物品1、用戶2購買了物品1、用戶1購買了物品2等。然后根據各個物品所具備的標簽和用戶對各個物品執行的行為,確定用戶對各個標簽的行為權重。最后分別根據每一個標簽對應的標簽權重和行為權重,計算得到用戶對該標簽的喜好程度,整合用戶對各個標簽的喜好程度得到用戶畫像。例如,用戶對某一標簽的喜好程度,可采用該標簽對應的標簽權重與行為權重的乘積表示。
然而,在現有技術中,由于需要人工為每一個標簽設定相應的標簽權重,而標簽的數量往往較多,這就導致需要花費大量的時間和人力資源,獲取用戶畫像所耗費的時間和人力成本較高;并且,由于人工設定標簽權重的方式難免存在誤差,很難保證人工設定的標簽權重與實際業務相符,導致最終獲取的用戶畫像的準確度較低。
發明內容
為了解決現有技術提供的獲取用戶畫像的方法,所耗費的時間和人力成本較高,且獲取的用戶畫像的準確度較低的問題,本發明實施例提供了一種獲取用戶畫像的方法、裝置、服務器及存儲介質。所述技術方案如下:
根據本發明實施例的第一方面,提供了一種獲取用戶畫像的方法,所述方法包括:
根據用戶行為日志,獲取M個訓練樣本;其中,訓練樣本u,i,j用于反映用戶u對物品i和物品j的喜好程度的差異,所述M為正整數;
根據所述訓練樣本,采用數據擬合模型修正初始化的用戶參數矩陣Wm×k和初始化的標簽參數矩陣Hk×n,得到最終的用戶參數矩陣Wm×k和最終的標簽參數矩陣Hk×n;其中,所述m表示用戶個數,所述k表示因子個數,所述n表示標簽個數,所述m為正整數,所述k為正整數,所述n為大于1的整數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910645998.3/2.html,轉載請聲明來源鉆瓜專利網。





