[發(fā)明專利]一種針對購物節(jié)的搜索廣告轉(zhuǎn)化率預測方法及裝置有效
| 申請?zhí)枺?/td> | 202010146512.4 | 申請日: | 2020-03-05 |
| 公開(公告)號: | CN111352976B | 公開(公告)日: | 2023-05-09 |
| 發(fā)明(設計)人: | 賴粵;錢毅霖;余榮;吳茂強 | 申請(專利權(quán))人: | 廣東工業(yè)大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N20/00;G06Q30/0201;G06Q30/0242 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 黃忠 |
| 地址: | 510060 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 購物 搜索 廣告 轉(zhuǎn)化 預測 方法 裝置 | ||
本申請公開了一種針對購物節(jié)的搜索廣告轉(zhuǎn)化率預測方法及裝置,包括:獲取購物節(jié)當天以及購物節(jié)之前的購物數(shù)據(jù)集;將購物節(jié)之前的購物數(shù)據(jù)集作為第一訓練集,訓練廣告轉(zhuǎn)化率模型,預測得到購物節(jié)當天的第一預測結(jié)果;將購物節(jié)當天的部分時間的購物數(shù)據(jù)集作為第二訓練集,將購物節(jié)當天的另一部分時間的購物數(shù)據(jù)集作為測試集,將第二訓練集中的部分數(shù)據(jù)作為驗證集,將第一預測結(jié)果作為新特征分別加入到第二訓練集、驗證集以及測試集中;訓練廣告轉(zhuǎn)化率模型,得到購物節(jié)當天的最終預測結(jié)果。解決了日常時期構(gòu)建的訓練集預測購物節(jié)時期構(gòu)建的測試集導致預測結(jié)果不準確的問題。
技術領域
本申請涉及數(shù)據(jù)挖掘技術領域,尤其涉及一種針對購物節(jié)的搜索廣告轉(zhuǎn)化率預測方法及裝置。
背景技術
搜索廣告是根據(jù)用戶搜索行為在返回界面中展現(xiàn)的與搜索詞相關的廣告。電商平臺作為一個復雜的系統(tǒng),會受到各種因素的影響。在諸如雙十一、618等大型購物節(jié),商家和平臺的各種活動會導致流量分布的急劇變化,我們稱這種特殊時期的廣告轉(zhuǎn)化相關數(shù)據(jù)為特殊流量。而日常時期訓練的模型很難有效地匹配特殊流量。
對于該類問題,與本發(fā)明最相似的實現(xiàn)方案是把轉(zhuǎn)化率預測當做傳統(tǒng)的回歸預測問題,通過滑動時間窗口的方法對數(shù)據(jù)集進行劃分,使用多個不同機器學習算法作為模型,運用Stacking方法進行融合,得到最終的結(jié)果。
現(xiàn)有技術常常將傳統(tǒng)的回歸問題預測方法不加修改地遷移到轉(zhuǎn)化率預測問題上來,或者很少對日常時期和大型購物節(jié)時期兩種數(shù)據(jù)分布下的轉(zhuǎn)化率預測方法加以區(qū)分。因此,現(xiàn)有技術存在以下幾個缺點,包括:1、沒有針對大型購物節(jié)時期的特殊數(shù)據(jù)分布進行適配,而是直接用日常時期構(gòu)建的訓練集預測購物節(jié)時期構(gòu)建的測試集。由于日常時期數(shù)據(jù)集中平均轉(zhuǎn)化率較低,如果用它來預測高轉(zhuǎn)化率的測試集,可以想見預測結(jié)果會偏低;2、對高維特征采用獨熱向量編碼,或是不加區(qū)分地對所有特征都采用同一種方法進行編碼,這些編碼方法效果都不夠好,還有很大的提升空間;3、現(xiàn)有方案使用固定的時間窗口滑窗提取特征,但購物節(jié)及其附近時期存在多種不同的數(shù)據(jù)分布,需要進行另一種方式的數(shù)據(jù)集劃分,避免造成數(shù)據(jù)的浪費;4、現(xiàn)有方案在計算轉(zhuǎn)化率特征時采用貝葉斯平滑法進行平滑處理,但這種方法計算參數(shù)的時間較長,當轉(zhuǎn)化率特征較多時,效率將嚴重下降,需要另行采取時間上更快的平滑方法;5、現(xiàn)有方案采取多種不同機器學習算法分別預測,采用加權(quán)或Stacking方法對多個模型進行融合。多模型預測的缺點是雖然精度比較高,但會耗費更多的時間,同時可能還需要構(gòu)建不同的特征工程;融合方法的缺點是:①加權(quán)方法權(quán)重不容易確定;②Stacking方法對包含時間序列因素的數(shù)據(jù)集會有數(shù)據(jù)穿越問題。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N針對購物節(jié)的搜索廣告轉(zhuǎn)化率預測方法及裝置,使得解決了日常時期構(gòu)建的訓練集預測購物節(jié)時期構(gòu)建的測試集導致預測結(jié)果不準確的問題。
有鑒于此,本申請第一方面提供了一種針對購物節(jié)的搜索廣告轉(zhuǎn)化率預測方法,所述方法包括:
獲取購物節(jié)當天以及購物節(jié)之前的購物數(shù)據(jù)集;
將所述購物節(jié)之前的購物數(shù)據(jù)集作為第一訓練集,訓練廣告轉(zhuǎn)化率模型,預測得到購物節(jié)當天的第一預測結(jié)果;
將購物節(jié)當天的部分時間的所述購物數(shù)據(jù)集作為第二訓練集,將購物節(jié)當天的另一部分時間的所述購物數(shù)據(jù)集作為測試集,將所述第二訓練集中的部分數(shù)據(jù)作為驗證集,將所述第一預測結(jié)果作為新特征分別加入到所述第二訓練集、所述驗證集以及所述測試集中;
采用加入新特征的所述第二訓練集、所述驗證集以及所述測試集訓練所述廣告轉(zhuǎn)化率模型,得到購物節(jié)當天的最終結(jié)果。
可選的,在所述將購物節(jié)之前的購物數(shù)據(jù)集作為第一訓練集,訓練所述廣告轉(zhuǎn)化率模型,預測得到購物節(jié)當天的第一預測結(jié)果,之前還包括:
將所述購物數(shù)據(jù)集中的數(shù)據(jù)進行預處理,得到符合廣告轉(zhuǎn)化率模型輸入格式的數(shù)據(jù)。
可選的,所述將所述購物數(shù)據(jù)集中的數(shù)據(jù)進行預處理具體為:
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學,未經(jīng)廣東工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010146512.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





