[發明專利]基于用戶行為特征挖掘用戶潛在購買商品和品類的方法在審
| 申請號: | 201910687675.0 | 申請日: | 2019-07-29 |
| 公開(公告)號: | CN110555717A | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 程銳;張艷青;楊漫瑤 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q30/06 |
| 代理公司: | 44245 廣州市華學知識產權代理有限公司 | 代理人: | 林梅繁 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預測模型 正負樣本 購買商品 融合 用戶行為特征 預處理 用戶行為分析 決策樹模型 工程處理 數據編碼 數據挖掘 樣本數據 樣本子集 預測結果 欠采樣 轉換率 權重 商戶 分析 挖掘 分類 營銷 預測 購買 幫助 | ||
1.基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,包括:
數據清洗與數據預處理,得到預處理后的數據;
對預處理后的數據進行數據編碼,并提取基本特征、統計類特征、時間間隔類特征、計算類特征,對提取的特征通過過濾法進行特征重要性評估,篩選出重要特征和冗余特征,在進行特征重要性評估過程,針對某些用戶行為離預測時間越近對結果影響越大,引入時間衰退理論,對數據特征進行加權處理,得到用戶行為特征數據;
對樣本數據進行正負樣本分析與分類,將正負樣本通過動態欠采樣處理生成多個樣本子集,作為訓練的正負樣本數據;
通過正負樣本數據對決策樹模型進行訓練,訓練出多個單預測模型,再通過stacking方式對單預測模型進行融合,生成多個融合預測模型;
利用融合預測模型進行預測,將預測結果與期望值進行對比,反饋給決策樹模型進行參數調整和模型再訓練,直到得出最優的模型參數;
基于多個融合預測模型對用戶潛在購買商品和品類進行預測,對各個融合預測模型的預測結果進行處理分析,得到帶有權重的用戶潛在購買商品和品類。
2.根據權利要求1所述的基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,過濾法指的是采用相關系數法對每個特征按照指標進行打分,這個評分即代表著這個特征的重要性,然后依據評分對特征進行排序。
3.根據權利要求2所述的基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,采用卡方過濾計算每個非負特征和標簽之間的卡方統計量,并依照卡方統計量由高到低為特征排名,選出前K個分數最高的特征的類,借此除去最可能獨立于標簽,與分類目的無關的特征。
4.根據權利要求1所述的基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,樣本數據包括某個用戶對于某個商品在一段時間內的行為特征數據、商品、用戶本身的特征數據。
5.根據權利要求1所述的基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,動態欠采樣處理是針對樣本數量過大的那部分樣本,通過一定的方法抽取部分樣本,以協調其與其他樣本的比例不均衡情況。
6.根據權利要求5所述的基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,通過隨機抽取的方式,從負樣本中抽取一定數量的子樣本,與正樣本組合成新的樣本集。
7.根據權利要求1所述的基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,采用的決策樹模型為RF和GDBT算法。
8.根據權利要求1所述的基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,其特征在于,多個單預測模型通過stacking方式生成融合預測模型過程包括:
在處理好正負樣本后,生成n個樣本訓練集train_x、…、train_y和測試集test;
①選擇一種未經訓練的決策樹模型;
②抽取其中n-1份作為小的訓練集s_train_x、…、s_train_y,另外一份作為小的測試集s_test,測試集test不變;
③以s_train_x、…、s_train_y訓練決策樹模型,訓練出的模型預測s_test得出對應的s_pred,再預測test得出y_pred;
④在訓練集再選擇另外一份作為小的測試集s_test_x,其他n-1份作為訓練集訓練決策樹模型;
⑤重復②、③、④步驟n次,得到n個s_pred和n個y_pred;
n個s_pred作為一個train_X,原始的train_y作為train_Y訓練融合預測模型得到模型G,n個y_pred取個平均值作為新的test_X,把test_X帶入到模型G中得出預測結果;
以上就是stacking的第一層,在第二層中,以第一層的輸出訓練集train_X、train_Y、測試集test_X再結合其他的特征集再做一層stacking,重復上面的步驟,生成最終的融合預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910687675.0/1.html,轉載請聲明來源鉆瓜專利網。





