[發明專利]一種點擊率預估模型的構建方法、點擊率預估方法和裝置有效
| 申請號: | 201811428618.2 | 申請日: | 2018-11-27 |
| 公開(公告)號: | CN109544241B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | 陳曉爽;鄭胤;馬文曄;黃俊洲 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06Q30/0202 | 分類號: | G06Q30/0202;G06Q30/0242;G06F18/22;G06F18/214 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 點擊率 預估 模型 構建 方法 裝置 | ||
本申請實施例公開了一種點擊率預估模型的構建方法、點擊率預估方法和裝置,點擊率預估模型設置了N個不同的候選維數,從所述N個不同的候選維數中確定一個候選維數作為目標特征對應的最大維數,將所述N個不同的候選維數中小于所述最大維數的i個候選維數確定為所述特征對應的投影維數;目標特征具有一個對應的最大維數和i個對應的投影維數,可以為目標特征分別訓練i+1個特征向量。由此,最大維數對應的特征向量可以合理的體現目標特征在訓練樣本中的信息,不會出現對過擬合或者欠擬合的問題。而且,不會影響目標特征與最大維數小于自己的其他特征進行特征向量的內積計算,從而達到較高的預估精度。
技術領域
本申請涉及數據處理領域,特別是涉及一種點擊率預估模型的構建方法、點擊率預估方法和相關裝置。
背景技術
點擊率是客戶端上某一內容(新聞、廣告或產品)被用戶點擊的次數與被顯示次數之比,也就是該內容被用戶點擊的概率。在在線應用中,對于用戶對某個內容的點擊率進行預測,從而決定是否向用戶推薦該類信息,是提高用戶體驗的重要方式。對點擊率進行預估的模型稱為點擊率預估模型,該類模型根據用戶和內容的相關信息等,通過點擊率預估模型可以預估出用戶在某一背景下點擊某個內容的概率。
分解機(Factorization?Machine,?FM)模型是一種常用的點擊率預估模型。在FM模型中,將用戶、內容等分別作為不同的特征,每個特征分配有對應的特征向量,在預估用戶對某內容的點擊率時,可以通過FM模型計算用戶和內容各自對應的特征向量間的內積,以得到預估結果。
計算特征向量間內積的前提是計算所涉及的特征向量的維數相同。因此,在傳統方式中,為了便于計算特征向量間的內積,在FM模型中,為不同的特征所分配的特征向量必須具有相同的維數。
然而,在真實的數據中,大量的特征都只有較少的非零樣本,只有少量的特征由較多的非零樣本。以內容具體是電影為例,少量的熱門電影的觀看次數(即樣本數)很多,而大量的冷門電影的觀看次數都會相對較少。非零樣本較少的特征采用維數較少的特征向量即可體現該特征的內容,非零樣本較多的特征需要采用維數較多的特征向量才可體現該特征的內容。
但是傳統方式中的FM模型等點擊率預估模型為了能夠計算不同特征的特征向量間的內積,針對不同特征所分配的特征向量維數均相同,由此導致某些特征對應的特征向量過擬合,例如冷門電影的特征向量,某些特征向量欠擬合,例如熱門電影的特征向量,從而影響點擊率的預估精度。
發明內容
為了解決上述技術問題,本申請提供了一種點擊率預估模型的構建方法、點擊率預估方法和裝置,構建的點擊率預估模型不會出現對過擬合或者欠擬合的問題,且不會影響目標特征與最大維數小于自己的其他特征進行特征向量的內積計算,從而達到較高的預估精度。
本申請實施例公開了如下技術方案:
第一方面,本申請實施例提供了一種點擊率預估模型的構建方法,所述點擊率預估模型設置了N個不同的候選維數,N為大于等于2的自然數;所述候選維數用于標識特征向量的維數,所述方法包括:
從所述N個不同的候選維數中確定一個候選維數作為目標特征對應的最大維數;
將所述N個不同的候選維數中小于所述最大維數的i個候選維數確定為所述目標特征對應的投影維數;i為小于N、大于等于1的自然數;
根據所述目標特征對應的訓練樣本,為所述目標特征分別訓練i+1個不同維數的特征向量,所述i+1個不同維數的特征向量中,任意一個特征向量的維數為所述目標特征對應的所述最大維數和所述投影維數中的一個。
第二方面,本申請實施例提供了一種點擊率預估方法,所述方法包括:
獲取包括多個特征的待估計樣本,所述多個特征至少包括第一特征和第二特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811428618.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電視策略沖突處理方法、系統及存儲介質
- 下一篇:一種平臺廣告精準推送方法





