[發明專利]基于KNN的時序遷移學習在銷量預測中的應用在審
| 申請號: | 202011010247.3 | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112150201A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 錢虹;翟君怡;江元元 | 申請(專利權)人: | 創絡(上海)數據科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q30/06;G06F16/2458;G06K9/62 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 杜蔚瓊 |
| 地址: | 201100 上海市閔*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 knn 時序 遷移 學習 銷量 預測 中的 應用 | ||
1.一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:以Lookalike作為KNN的輪廓范圍識別基準,計算獲得具有相似時序特征指數的對象集作為可識別對象群,將包含可識別對象群的所有指標集作為遷移樣本,通過使用隨機森林Random Forest Tree模型,進行遷移學習建模以獲得銷量預測模型。
2.如權利要求1所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于,具體步驟如下所示:
S1:以指定粒度計算出衍生指標群,得到樣本集Smp;
S2:以區域+SKU計算時序特征指數;
S3:計算每個區域+SKU的時序特征指數與其他區域+SKU的時序特征指數的相似度;
S4:計算產生供遷移學習的拓展遷移樣本;
S5:設原指標集為原始源域樣本DataS,ExtObjList_SmpTr為拓展遷移樣本,合成的遷移源域樣本為:Smp_Tr=DataS∪ExtObjList_SmpTr;
Smp=Smp_Tr;
S6:將S3-S5中每個樣本集Smp疊加,形成KNN疊加樣本Smp_KNN;
S7:在疊加樣本Smp_KNN中,以指定指標Dim作為因變量、Train_Y為預測目標,使用隨機森林訓練建模,得到Train_Y=F(Dim)。
3.如權利要求2所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
所述時序特征指數為季節指數序列。
4.如權利要求2所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
所述S3中相似度包括皮爾遜系數和距離系數。
5.如權利要求2所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
所述S3中相似度的具體計算方法如下:
Sim=1–R
其中,Fs為源域中觀測對象的時序特征指數;
Ft為源域中的候選對象的時序特征指數為;
n為時序特征指數的指數數量。
6.如權利要求2所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
所述S4中拓展遷移樣本的計算方法為:針對每個區域+SKU的時序特征指數,
S4-1.篩選出和該對象相似度滿足特定的Sim和D值范圍的所有對象集Obj,并將其加入到拓展的Lookalike對象池ExtObj中;
S4-2.將每個Obj對應的若干條指標集,加入到拓展的Lookalike對象樣本池ExtObjList_SmpTr中。
7.如權利要求6所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
F(Sim,D)-Max。
8.如權利要求6所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
Sim指定數值I且D=指定數值II;
其中,所述指定數值I選自0-0.50中的任一數值。
9.如權利要求2所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
將S7中的樣本集劃分為測試集和訓練集;
其中,訓練集用于訓練模型,測試集用于對模型進行評估。
10.如權利要求9所述的一種基于KNN的時序遷移學習的銷量預測方法,其特征在于:
將訓練獲得的模型,使用測試集數據進行預測,F(Dim)=Data_Y。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創絡(上海)數據科技有限公司,未經創絡(上海)數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011010247.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:殘余電壓的檢測裝置
- 下一篇:數字激光無墨彩色印刷方法





