[發(fā)明專利]基于用戶行為特征挖掘用戶潛在購買商品和品類的方法在審
| 申請?zhí)枺?/td> | 201910687675.0 | 申請日: | 2019-07-29 |
| 公開(公告)號: | CN110555717A | 公開(公告)日: | 2019-12-10 |
| 發(fā)明(設(shè)計)人: | 程銳;張艷青;楊漫瑤 | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q30/06 |
| 代理公司: | 44245 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司 | 代理人: | 林梅繁 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 預(yù)測模型 正負樣本 購買商品 融合 用戶行為特征 預(yù)處理 用戶行為分析 決策樹模型 工程處理 數(shù)據(jù)編碼 數(shù)據(jù)挖掘 樣本數(shù)據(jù) 樣本子集 預(yù)測結(jié)果 欠采樣 轉(zhuǎn)換率 權(quán)重 商戶 分析 挖掘 分類 營銷 預(yù)測 購買 幫助 | ||
本發(fā)明屬于用戶行為分析和數(shù)據(jù)挖掘領(lǐng)域,涉及一種基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,對預(yù)處理后的數(shù)據(jù)進行數(shù)據(jù)編碼,并進行特征工程處理,得到用戶行為特征數(shù)據(jù);對樣本數(shù)據(jù)進行正負樣本分析與分類,將正負樣本通過動態(tài)欠采樣處理生成多個樣本子集,作為訓(xùn)練的正負樣本數(shù)據(jù);通過正負樣本數(shù)據(jù)對決策樹模型進行訓(xùn)練,訓(xùn)練出多個單預(yù)測模型,再通過stacking方式對單預(yù)測模型進行融合,生成多個融合預(yù)測模型;基于多個融合預(yù)測模型對用戶潛在購買商品和品類進行預(yù)測,對各個融合預(yù)測模型的預(yù)測結(jié)果進行處理分析,得到帶有權(quán)重的用戶潛在購買商品和品類。本發(fā)明能幫助商戶發(fā)掘高潛在購買意向的用戶,提高營銷的用戶消費轉(zhuǎn)換率。
技術(shù)領(lǐng)域
本發(fā)明屬于用戶行為分析和數(shù)據(jù)挖掘領(lǐng)域,涉及一種基于用戶行為特征挖掘用戶潛在購買商品和品類的方法。
背景技術(shù)
在電子商務(wù)快速發(fā)展的今天,主動性營銷才可以在商品同質(zhì)化泛濫的市場中讓商家脫穎而出,吸引用戶并切實地提高營銷的用戶消費轉(zhuǎn)化率。怎么去主動營銷,傳統(tǒng)方式是通過廣告宣傳、媒體傳播方式,但是這些方式拼的是流量,獲取用戶的轉(zhuǎn)化率的高低基本也是在拼運氣,因此要找到一個更加有效的方法去提高用戶消費轉(zhuǎn)化率,關(guān)鍵在于如何精準的獲取目標用戶,并向其進行推送最可能購買的商品信息,而如何去獲取目標用戶和目標商品,就涉及到挖掘和預(yù)測的問題。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于用戶行為特征挖掘用戶潛在購買目標商品品類的方法。
本發(fā)明采用如下技術(shù)方案實現(xiàn):
基于用戶行為特征挖掘用戶潛在購買商品和品類的方法,包括:
數(shù)據(jù)清洗與數(shù)據(jù)預(yù)處理,得到預(yù)處理后的數(shù)據(jù);
對預(yù)處理后的數(shù)據(jù)進行數(shù)據(jù)編碼,并提取基本特征、統(tǒng)計類特征、時間間隔類特征、計算類特征,對提取的特征通過過濾法進行特征重要性評估,篩選出重要特征和冗余特征,在進行特征重要性評估過程,針對某些用戶行為離預(yù)測時間越近對結(jié)果影響越大,引入時間衰退理論,對數(shù)據(jù)特征進行加權(quán)處理,得到用戶行為特征數(shù)據(jù);
對樣本數(shù)據(jù)進行正負樣本分析與分類,將正負樣本通過動態(tài)欠采樣處理生成多個樣本子集,作為訓(xùn)練的正負樣本數(shù)據(jù);
通過正負樣本數(shù)據(jù)對決策樹模型進行訓(xùn)練,訓(xùn)練出多個單預(yù)測模型,再通過stacking方式對單預(yù)測模型進行融合,生成多個融合預(yù)測模型;
利用融合預(yù)測模型進行預(yù)測,將預(yù)測結(jié)果與期望值進行對比,反饋給決策樹模型進行參數(shù)調(diào)整和模型再訓(xùn)練,直到得出最優(yōu)的模型參數(shù);
基于多個融合預(yù)測模型對用戶潛在購買商品和品類進行預(yù)測,對各個融合預(yù)測模型的預(yù)測結(jié)果進行處理分析,得到帶有權(quán)重的用戶潛在購買商品和品類。
進一步地,過濾法指的是采用相關(guān)系數(shù)法對每個特征按照指標進行打分,這個評分即代表著這個特征的重要性,然后依據(jù)評分對特征進行排序。
優(yōu)選地,采用卡方過濾計算每個非負特征和標簽之間的卡方統(tǒng)計量,并依照卡方統(tǒng)計量由高到低為特征排名,選出前K個分數(shù)最高的特征的類,借此除去最可能獨立于標簽,與分類目的無關(guān)的特征。
優(yōu)選地,樣本數(shù)據(jù)包括某個用戶對于某個商品在一段時間內(nèi)的行為特征數(shù)據(jù)、商品、用戶本身的特征數(shù)據(jù)。
進一步地,動態(tài)欠采樣處理是針對樣本數(shù)量過大的那部分樣本,通過一定的方法抽取部分樣本,以協(xié)調(diào)其與其他樣本的比例不均衡情況。
優(yōu)選地,通過隨機抽取的方式,從負樣本中抽取一定數(shù)量的子樣本,與正樣本組合成新的樣本集。
優(yōu)選地,采用的決策樹模型為RF和GDBT算法。
優(yōu)選地,多個單預(yù)測模型通過stacking方式生成融合預(yù)測模型過程包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910687675.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 一種基于方差最小的短期風(fēng)功率預(yù)測方法
- 模型自匹配融合健康預(yù)測方法
- 交通時間預(yù)測系統(tǒng)、交通時間預(yù)測方法以及交通模型建立方法
- 預(yù)測方法、訓(xùn)練方法、裝置、服務(wù)器及介質(zhì)
- 一種基于供電企業(yè)大數(shù)據(jù)模型庫的用電預(yù)測方法
- 信息預(yù)測方法和裝置
- 基于模型復(fù)用的模型預(yù)測方法、模型預(yù)測裝置及系統(tǒng)
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)
- 考慮預(yù)測誤差的機柜設(shè)備發(fā)熱量超短期預(yù)測方法及系統(tǒng)





