[發明專利]一種用戶行為預測方法及裝置有效
| 申請號: | 201610802500.6 | 申請日: | 2016-09-05 |
| 公開(公告)號: | CN107798332B | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 李長路 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/9535 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 行為 預測 方法 裝置 | ||
本發明實施例提供一種用戶行為預測方法及裝置,涉及大數據機器學習技術領域,能夠降低高階特征稀疏性在用戶行為預測過程中引起的偏差。具體方案為:預測裝置獲取第一樣本集中每個特征分別對應的權重;第一樣本集中的每個樣本包括行為標簽和第一特征向量,第一特征向量包括多個一階特征和多個高階特征,高階特征由多個一階特征組合而成;預測裝置記錄每個特征分別出現的頻次;確定第一頻次邊界;修正第一樣本集中每個特征分別對應的權重;其中,修正具體包括:減小頻次小于第一頻次邊界的特征分別對應的權重;根據修正后的每個特征分別對應的權重,預測目標第一特征向量與行為標簽的取值的概率對應關系。本發明實施例用于預測用戶行為。
技術領域
本發明實施例涉及大數據機器學習技術領域,尤其涉及一種用戶行為預測方法及裝置。
背景技術
目前,用戶行為預測作為現有個性化推薦、廣告精準投放等領域的重要技術,被廣泛關注和使用。以用戶行為預測中的點擊率預測為例,在實際應用場景中,用戶是否會點擊一個內容,不僅與用戶固有的偏好特征和內容的屬性特征有關,還與當時可能會影響用戶決策的上下文特征有關。現有技術通過在訓練樣本的特征向量中納入上下文特征,并通過特征組合生成高階特征,以反映不同特征對用戶行為預測的共同作用。
然而,現有技術中通過簡單的特征組合的方法生成的階數較高的特征,某些高階特征容易在訓練樣本集中出現頻次過低,即高階特征具有稀疏性,從而容易在訓練過程中發生局部過擬合,使得訓練得到的某些高階特征對應的權重不具備泛化能力,導致根據這些高階特征對應的權重進行用戶行為預測時出現偏差。
發明內容
本發明實施例提供一種用戶行為預測方法及裝置,能夠降低高階特征稀疏性在用戶行為預測過程中引起的偏差。
為達到上述目的,本發明的實施例采用如下技術方案:
第一方面,本發明實施例提供了一種用戶行為預測方法,該方法包括:預測裝置首先獲取第一樣本集中每個特征分別對應的權重。其中,第一樣本集包括多個樣本,第一樣本集中的每個樣本包括行為標簽和第一特征向量,第一特征向量包括多個一階特征和多個高階特征,高階特征由第一特征向量中的多個一階特征組合而成。其次,預測裝置記錄第一樣本集中每個特征分別出現的頻次。而后,預測裝置確定第一頻次邊界。之后,預測裝置修正第一樣本集中每個特征分別對應的權重。其中,修正具體包括:預測裝置減小頻次小于第一頻次邊界的特征分別對應的權重。然后,預測裝置根據修正后的第一樣本集中每個特征分別對應的權重,預測目標第一特征向量與行為標簽的取值的概率對應關系。
從而,通過減小頻次小于第一頻次邊界的特征對應的權重,預測裝置可以抑制頻次過低的高階特征對應的權重,降低高階特征稀疏性在用戶行為預測過程中引起的偏差。
在一種可能的實現方式中,預測裝置確定第一頻次邊界包括:預測裝置根據第一樣本集中最高階特征出現的頻次的平均值,確定第一頻次邊界。
其中,由于第一頻次邊界用于區分正常頻次的特征和頻次過低的特征,因而第一頻次邊界的取值可以參考第一樣本集中最高階特征出現的頻次的平均值。
在一種可能的實現方式中,第一頻次邊界小于第一樣本集中最高階特征出現的頻次的平均值,以盡量確保頻次小于第一頻次邊界的特征為頻次過低的問題特征。
在一種可能的實現方式中,該方法還包括:預測裝置確定第二頻次邊界,第二頻次邊界大于第一頻次邊界。該修正還包括:預測裝置減小頻次大于第二頻次邊界的特征分別對應的權重。
從而,通過減小頻次大于第二頻次邊界的特征分別對應的權重,預測裝置還可以抑制頻次過高的特征對應的權重,降低高頻曝光問題在用戶行為預測過程中引起的偏差。
在一種可能的實現方式中,預測裝置確定第二頻次邊界包括:預測裝置根據第一樣本集中一階特征出現的頻次的平均值,確定第二頻次邊界。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610802500.6/2.html,轉載請聲明來源鉆瓜專利網。





