[發明專利]一種基于集成模型的電商優惠券使用概率預測方法在審
| 申請號: | 201810517366.4 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN108876436A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 石純一;石濤;李衛軍 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510006 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 集成模型 優惠券使用 概率預測 優惠券 預測 單模型 學習器 商戶 概率 促銷效果 技術構建 數據挖掘 樣本數據 用戶使用 預測模型 運營成本 構建 發放 | ||
1.一種基于集成模型的電商優惠券使用概率預測方法,其特征在于,包括以下步驟:
S1.統計用戶線上線下的歷史消費數據并進行預處理,所述預處理包括剔除缺失率超過設定閾值的數據以及對缺失的數據進行填補,得到第一數據集;
S2.對步驟S1中第一數據集中的數據進行特征提取得到待分析的特征,構建特征體系,所述特征體系包括商戶特征、優惠券特征、用戶特征、用戶與商戶組合特征以及其他特征;
S3.將步驟S1中第一數據集分為正類數據和負類數據,所述負類數據為領取的優惠券數量大于使用的優惠券數量的數據,所述正類數據為第一數據集中除負類數據外的數據;選取所有的正類數據,并多次隨機采取與正類數據數量1~1.5倍的負類數據,形成訓練樣本;構建初級學習器,輸入所述訓練樣本的特征變量,輸出各個抽樣樣本預測的概率值;
S4.構建次級學習器,輸入為步驟S3中初級學習器基于各個訓練樣本預測的概率值,輸出為基于整個訓練樣本預測的概率值。
2.根據權利要求1所述的基于集成模型的電商優惠券使用概率預測方法,其特征在于,步驟S1中,對統計得到的用戶線上線下的歷史消費數據進行歸一化處理。
3.根據權利要求1所述的基于集成模型的電商優惠券使用概率預測方法,其特征在于,步驟S2包括以下步驟:
S21.對步驟S1中第一數據集進行數據清洗,去除噪聲,獲得第二數據集;
S22.對步驟S21所述的第二數據集中的數據分析數據的構造參數,所述構造參數包括分布特征、覆蓋率、區分度以及可用性;
S23.對步驟S21所述的第二數據集建立多維度數據模型,提取出多個特征體系,所述特征體系包括商戶特征、優惠券特征、用戶特征、用戶與商戶組合特征以及其他特征;
S24.通過組合步驟S23中商戶特征、優惠券特征、用戶特征、用戶與商戶組合特征以及其他特征五大特征體系中的特征構造復雜特征,所述特征組合的方法包括比值法、排序法、交叉法以及加權求和法。
4.根據權利要求3所述的基于集成模型的電商優惠券使用概率預測方法,其特征在于,步驟S23所述多維度數據包括User、Merchant、Coupon、Discount_rate、Distance、Date_received、Date七個維度的數據。
5.根據權利要求4所述的基于集成模型的電商優惠券使用概率預測方法,其特征在于,在步驟S24后,還包括:將步驟S23中所述特征體系通過SQL或者Python.Pandas合并語句融合到一張表上,并通過這張表生成所述多維度數據模型的預測變量。
6.根據權利要求1所述的基于集成模型的電商優惠券使用概率預測方法,其特征在于,步驟S3中所述初級學習器為Logistic回歸、決策樹以及支持向量機中的至少兩種的組合。
7.根據權利要求6所述的基于集成模型的電商優惠券使用概率預測方法,其特征在于,步驟S3中所述初級學習器由數量相等的Logistic回歸、決策樹以及支持向量機組成。
8.根據權利要求7所述的基于集成模型的電商優惠券使用概率預測方法,其特征在于,所述次級學習器為支持向量機。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810517366.4/1.html,轉載請聲明來源鉆瓜專利網。





