[發明專利]一種目標特征組合的構建方法和裝置在審
| 申請號: | 202110181919.5 | 申請日: | 2021-02-09 |
| 公開(公告)號: | CN112907284A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 付金偉 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06N3/12 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 李曼 |
| 地址: | 200030 上海市徐匯區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 目標 特征 組合 構建 方法 裝置 | ||
本申請提供了一種目標特征組合的構建方法和裝置,屬于CTR預估技術領域。所述方法包括:從數據集中獲取多個字段特征,其中,所述數據集中包含與廣告關聯的多條日志記錄,每個所述字段特征指示所述日志記錄中的一個字段對應的信息;通過對多個所述字段特征進行組合,得到多個組合特征,其中,所述每個所述組合特征是對至少兩個所述字段特征進行組合得到的;通過遺傳方案從多個所述組合特征中選取出第一組合特征和第二組合特征,其中,第一組合特征和第二組合特征不同;將所述第一組合特征和所述第二組合特征進行交叉或變異中的至少一個操作,得到目標特征組合。本申請提高了CTR預估的準確性。
技術領域
本申請涉及CTR預估技術領域,尤其涉及一種目標特征組合的構建方法和裝置。
背景技術
網絡廣告是一種通過網絡傳遞到互聯網用戶的高科技廣告運作方式,目前投放廣告一般是使用在網頁上提供的廣告位登載設定有URL(Uniform Resource Locator,統一資源定位符)鏈接的互聯網廣告,當用戶點擊該互聯網廣告時,會跳轉到該互聯網廣告的廣告網頁,這樣廣告業主達成推送該廣告的目的。對一組廣告的CTR(Click Through Rate,網絡廣告的點擊率)預估的準確性決定了DSP(Demand-Side Platform,需求方平臺)投放該組廣告時的出價,一般CTR預估值越高,則出價越高,反之出價越低。
目前業界針對CTR預估問題大量使用的是廣義線性模型LR(LogisticRegression,邏輯回歸)+人工特征工程。LR使用了Logit變換將函數值映射到0-1區間,映射后的函數值就是CTR的預估值。LR作為線性模型很容易并行化,可以輕松的處理上億條訓練樣本,性能較高,而且預測結果可解釋性強。但由于線性模型的學習能力有限,該技術只能對字段特征進行處理,所以表達能力有限,如果要增強表達能力,則需要引入大量的領域知識來人工設計特征以及特征之間的交叉組合,從而間接補充算法的非線性學習能力,消耗大量的人力和機器資源,且需要大量的經驗積累,在不同領域遷移后難以保證預測的效果。
此外,基于超高維度的深度學習模型也別廣泛用于CTR預估領域,例如超高維度的分解機模型以及寬度深度模型等,自動學習高階屬性的權值,不需要通過人工的方式選取特征來做交叉。但該技術嚴重缺乏對CTR預估結果的合理分析和解釋,因而,這種CTR預估方法難以給出預測理由也難以進行優化調整。
發明內容
本申請實施例的目的在于提供一種目標特征組合的構建方法和裝置,以解決CTR預估不準確問題。具體技術方案如下:
第一方面,提供了一種目標特征組合的構建方法,所述方法包括:
從數據集中獲取多個字段特征,其中,所述數據集中包含與廣告關聯的多條日志記錄,每個所述字段特征指示所述日志記錄中的一個字段對應的信息;
通過對多個所述字段特征進行組合,得到多個組合特征,其中,所述每個所述組合特征是對至少兩個所述字段特征進行組合得到的;
通過遺傳方案從多個所述組合特征中選取出第一組合特征和第二組合特征,其中,第一組合特征和第二組合特征不同;
將所述第一組合特征和所述第二組合特征進行交叉或變異中的至少一個操作,得到目標特征組合。
可選地,從數據集中獲取多個字段特征之后,所述方法還包括:確定所述字段特征對應的獨熱碼;
所述通過對多個所述字段特征進行組合得到多個組合特征包括:通過對多個獨熱碼進行組合得到多個組合特征編碼;
所述通過遺傳方案從多個所述組合特征中選取出第一組合特征和第二組合特征包括:通過所述遺傳方案確定所述組合特征編碼對應的適應性函數值;選取適應性函數值大于第一預設閾值的第一組合特征值和適應性函數值大于第二預設閾值的第二組合特征值,其中,所述第一預設閾值與所述第二預設閾值不同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110181919.5/2.html,轉載請聲明來源鉆瓜專利網。





