[發明專利]一種基于集成模型的電商優惠券使用概率預測方法在審
| 申請號: | 201810517366.4 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN108876436A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 石純一;石濤;李衛軍 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510006 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 集成模型 優惠券使用 概率預測 優惠券 預測 單模型 學習器 商戶 概率 促銷效果 技術構建 數據挖掘 樣本數據 用戶使用 預測模型 運營成本 構建 發放 | ||
本發明涉及數據挖掘的技術領域,更具體地,涉及一種基于集成模型的電商優惠券使用概率預測方法。本發明的基于集成模型的電商優惠券使用概率預測方法,構建包括初級學習器和次級學習器的集成模型,結合特定單模型在預測優惠券使用概率時的優點,規避單模型預測的缺陷。在樣本數據很大的情況下,提升預測精確度,降低預測模型的泛化誤差。電商可以通過這種技術構建集成模型,更加精確的預測用戶使用優惠券的概率值,根據概率值決定是否對用戶發放優惠券,從而減少商戶的運營成本,更好的達到商戶想要的促銷效果。
技術領域
本發明涉及數據挖掘的技術領域,更具體地,涉及一種基于集成模型的電商優惠券使用概率預測方法。
背景技術
隨著移動設備的完善和普及,移動互聯網+各行各業進入了高速發展階段,這其中以電商消費最為吸引眼球。據不完全統計,電商行業估值上億的創業公司至少有10家,也不乏百億巨頭的身影。電商行業關聯數億消費者,各類APP每天記錄了超過百億條用戶行為和位置記錄,因而成為大數據科研和商業化運營的最佳結合點之一。以優惠券盤活老用戶或吸引新客戶進店消費是電商的一種重要營銷方式。
隨機投放的優惠券對多數用戶造成無意義的干擾。對商家而言,濫發的優惠券可能降低品牌聲譽,同時難以估算營銷成本,個性化投放是提高優惠券使用率的重要技術,它可以讓具有一定偏好的消費者得到真正的實惠,同時賦予商家更強的營銷能力。現有的優惠券使用預測技術,大多是基于用戶的購買行為數據進行基于單個分類模型的預測,然而當數據量很大時,單個分類模型容易過擬合,泛化誤差大,影響最終對于優惠券使用概率的預測,不能滿足電商對于優惠券使用概率的預測需求。
發明內容
本發明的目的在于克服現有技術的不足,提供一種基于集成模型的電商優惠券使用概率預測方法,結合單模型在預測優惠券使用概率時的優點,規避單模型預測的缺陷,提升預測精確度,降低預測模型的泛化誤差。
為解決上述技術問題,本發明采用的技術方案是:
提供一種基于集成模型的電商優惠券使用概率預測方法,其特征在于,包括以下步驟:
S1.統計用戶線上線下的歷史消費數據并進行預處理,所述預處理包括剔除缺失率超過設定閾值的數據以及對缺失的數據進行填補,得到第一數據集;
S2.對步驟S1中第一數據集中的數據進行特征提取得到待分析的特征,構建特征體系,所述特征體系包括商戶特征、優惠券特征、用戶特征、用戶與商戶組合特征以及其他特征;
S3.將步驟S1中第一數據集分為正類數據和負類數據,所述負類數據為領取的優惠券數量大于使用的優惠券數量的數據,所述正類數據為第一數據集中除負類數據外的數據;選取所有的正類數據,并多次隨機采取與正類數據數量1~1.5倍的負類數據,形成訓練樣本;構建初級學習器,輸入所述訓練樣本的特征變量,輸出各個抽樣樣本預測的概率值;
S4.構建次級學習器,輸入為步驟S3中初級學習器基于各個訓練樣本預測的概率值,輸出為基于整個訓練樣本預測的概率值。
本發明的基于集成模型的電商優惠券使用概率預測方法,通過構建集成模型,更加精確地預測用戶使用優惠券的概率值,根據概率值決定是否對用戶發送優惠券,從而減少商戶的運營成本,更好地達到商戶想要的促銷效果。
優選地,步驟S1中,對統計得到的用戶線上線下的歷史消費數據進行歸一化處理。由于統計時,不同特征的量綱和量綱單位不統一,會對預測模型評估特征權重造成較大影響,需要對特征進行歸一化處理,以解決特征之間的可比性。
優選地,步驟S2包括以下步驟:
S21.對步驟S1中第一數據集進行數據清洗,去除噪聲,獲得第二數據集;數據集中不可避免的存在噪聲,噪聲使得數據不能很準確地反映問題的實際情況,對于特征提取來說,異常值往往會使數據的方差增大,使得預測模型對正常范圍內的數據的變化敏感度降低。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810517366.4/2.html,轉載請聲明來源鉆瓜專利網。





