[發明專利]獲取用戶屬性的方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202010106105.0 | 申請日: | 2020-02-20 |
| 公開(公告)號: | CN111260419A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 余加騰;丁家文;鄧琛;梁鷹;王剛;趙子穎;黃毓銘 | 申請(專利權)人: | 世紀龍信息網絡有限責任公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 盧曉霞 |
| 地址: | 510630 廣東省廣州市天河*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 獲取 用戶 屬性 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種獲取用戶屬性的方法、裝置、計算機設備和存儲介質。所述方法包括:獲取與多維度的用戶行為特征對應的樣本用戶行為數據,以及樣本用戶屬性;將樣本用戶行為數據劃分為用戶行為訓練數據集以及用戶行為預測數據集;基于樣本用戶屬性,利用用戶行為訓練數據集訓練得到初始預測模型,并獲取初始預測模型對用戶行為預測數據集的第一預測擬合度;若第一預測擬合度滿足擬合度閾值,則將初始預測模型作為目標預測模型;獲取與多維度的用戶行為特征對應的待分析用戶行為數據;將待分析用戶行為數據輸入目標預測模型,得到待分析用戶的用戶屬性。本申請能夠提高數據的擬合效果,從而提高獲取的用戶屬性的準確率。
技術領域
本申請涉及數據處理技術領域,特別是涉及一種獲取用戶屬性的方法、裝置、計算機設備和存儲介質。
背景技術
隨著大數據技術的發展,各種新式產品不斷涌入市場,產生的用戶數據也越來越多,產品體驗效果也不盡相同。為了提高用戶產品體驗,可以通過用戶的手機通話時長等數據獲取使用該手機用戶的年齡分布等產品的用戶屬性分布特征,進而可以根據用戶分布特征改良產品,或者將相關產品推送給合適的用戶等,從而提高用戶產品體驗。
然而,相關技術中由于數據擬合效果差,導致獲取的用戶屬性準確率低。
發明內容
基于此,有必要針對上述技術問題,提供一種獲取用戶屬性的方法、裝置、計算機設備和存儲介質。
一種獲取用戶屬性方法,所述方法包括:
確定多維度的用戶行為特征;
獲取與所述多維度的用戶行為特征對應的樣本用戶行為數據,以及樣本用戶屬性;所述樣本用戶行為數據為樣本用戶的用戶行為數據;所述樣本用戶屬性為所述樣本用戶的用戶屬性;
將所述樣本用戶行為數據劃分為用戶行為訓練數據集以及用戶行為預測數據集;
基于所述樣本用戶屬性,利用所述用戶行為訓練數據集訓練得到初始預測模型,并獲取所述初始預測模型對所述用戶行為預測數據集的第一預測擬合度;
若所述第一預測擬合度滿足擬合度閾值,則將所述初始預測模型作為目標預測模型;
獲取與所述多維度的用戶行為特征對應的待分析用戶行為數據;所述待分析用戶行為數據為待分析用戶的用戶行為數據;
將所述待分析用戶行為數據輸入所述目標預測模型,得到所述待分析用戶的用戶屬性。
在一個實施例中,所述基于所述樣本用戶屬性,利用所述用戶行為訓練數據集訓練得到初始預測模型包括:基于所述樣本用戶屬性,利用所述用戶行為訓練數據集對訓練模型進行訓練,得到預測損失率以及預測準確率;利用所述懲罰變量、平滑梯度以及所述用戶行為訓練數據集再次對所述訓練模型進行訓練,以使所述訓練模型的模型參數得到更新;當所述訓練模型的訓練次數達到目標訓練次數時,基于所述訓練模型獲取所述初始預測模型。
在一個實施例中,所述基于所述訓練模型獲取所述初始預測模型,包括:獲取所述訓練模型的第二預測擬合度;若所述第二預測擬合度滿足所述擬合度閾值,則將所述訓練模型作為所述初始預測模型。
在一個實施例中,所述獲取所述訓練模型的第二預測擬合度之后,還包括:若所述第二預測擬合度不滿足所述擬合度閾值,則對所述多維度的用戶行為特征進行更新。
在一個實施例中,所述基于所述樣本用戶屬性,利用所述用戶行為訓練數據集訓練得到初始預測模型之前,還包括:獲取用于對所述用戶行為訓練數據集進行混洗的最大化混合算子系數以及最小化混合算子系數;通過混洗池,利用所述最大化混合算子系數以及最小化混合算子系數對所述用戶行為訓練數據集進行混洗,得到噪聲數據集;所述基于所述樣本用戶屬性,利用所述用戶行為訓練數據集訓練得到初始預測模型,包括:基于所述樣本用戶屬性,利用所述用戶行為訓練數據集以及所述噪聲數據集訓練得到所述初始預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于世紀龍信息網絡有限責任公司,未經世紀龍信息網絡有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010106105.0/2.html,轉載請聲明來源鉆瓜專利網。





