[發明專利]一種基于時間序列分解的商家客流量大數據預測方法有效
| 申請號: | 201711086963.8 | 申請日: | 2017-11-07 |
| 公開(公告)號: | CN107895283B | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 王進;范磊;陳知良;周瑞港;胡峰;鄧欣;李智星;雷大江;陳喬松 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 劉小紅 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時間 序列 分解 商家 客流量 數據 預測 方法 | ||
1.一種基于時間序列分解的商家客流量大數據預測方法,其特征在于,包括以下步驟:
101、對消費者和商家的歷史消費數據進行預處理;
102、對經過預處理的數據構建特征工程,提取商家特征和用戶支付行為特征,獲取基本特征,并將基本特征按照特征對的方式兩兩匹配,形成組合特征,針對大量的組合特征,采用特征選擇降維;
103、基于時間序列分解構建客流量預測模型;
104、對已建立模型進行多模型加權融合,預測商家客流量;
所述步驟101對歷史消費數據進行預處理,包括以下步驟:
S1011、將歷史數據分為訓練集和測試集兩部分,統計歷史數據中商家信息的缺失值個數,并統計各個商家的缺失比例,對于缺失比例低于80%的商家,使用該商家對應曜日的均值填充;若缺失比例超過80%,如果近7個曜日有值,則只保留近7個曜日的值,否則將商家對應曜日的值全部清空;
S1012、對經過S1011處理的數據,通過數據可視化分析,將含有明顯異常數據的那一周的數據全部剔除;
S1013、根據天氣影響外出消費的程度由弱到強分別將描述天氣的字段數值化,數值越大,外出消費意愿越小;
所述步驟102對經過預處理的數據構建特征工程,包括以下步驟:
S1021、根據歷史數據提取商家特征和用戶支付行為特征,并添加是否為節假日、周末、寒暑假期等影響消費的特征;
S1022、根據商家地理位置信息進行獨熱編碼,針對由此造成的很高維的稀疏特征,進一步做特征選擇——根據商家地理位置信息所屬省份統計出每個省份擁有商家數并可視化出熱力圖;
S1023、選取前N1-1個省份,其他省份則合為“其他”,故共得到N1個省份分布;
S1024、將N1個省份中的商家計數并取log,再等值離散到若干個區間;
S1025、通過用戶的支付時間反向估計商家的營業時間,根據商家各時段的客流量情況,將商家主要營業時間離散化,具體離散化為全部商家的主要營業時間以及每個商家的主要營業時間;
S1026、通過特征選擇來降低特征維度,首先使用訓練集訓練Xgboost模型,在模型訓練完成后輸出特征重要性,保留top N2的特征,其中N2為特征總數的70%;
N1的取值優化過程為:分別取N1的值為3-10之間的數值,進行后續步驟,并將最后預測結果代入評價指標中,得到的Loss最小值所對應的N1值即為最佳N1值;
所述步驟103基于時間序列分解構建客流量預測模型,具體為:
S1031、根據歷史數據,以日期為橫軸、客流量為縱軸分析出客流量整體變化趨勢;
S1032、從客流量整體變化趨勢中分解出每周客流量的變化趨勢;
S1033、分析每周內每天客流量的變化趨勢占本周客流量整體變化趨勢的占比;
S1034、分析給定時間段內每周內每個曜日的整體變化趨勢;
S1035、根據歷史數據,計算每周的客流量周均值,每周內每個曜日客流量的值除以周均值,得到一個比例值,然后按照曜日取比例值的均值和中位數,將均值和中位數分別分配不同權重,通過權重相加計算出周期因子;
S1036、將每個商家歷史數據中每個曜日的比例值減去周期因子,作為殘差標簽;
S1037、將每個商家每個曜日的特征作為樣本,給定歷史數據的殘差標簽作為標簽,使用Xgboost模型、RF模型、ET模型進行訓練,分別得到學習模型;
S1038、對測試集使用學習模型得到預測結果,加上對應的周期因子,再將比例值乘以base值,base值表示去周期客流量均值,得到該商戶某個曜日的客流量;
所述步驟S1038的base值的選取和優化策略為:去掉周期性因素后再取平均值,用客流量除以周期因子得到每個曜日的去周期客流量,選取距離預測時間最近的一段時間內的去周期客流量均值作為base。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711086963.8/1.html,轉載請聲明來源鉆瓜專利網。





