[發明專利]一種防止銷售預測模型過擬合的方法在審
| 申請號: | 201810283548.X | 申請日: | 2018-04-02 |
| 公開(公告)號: | CN108446771A | 公開(公告)日: | 2018-08-24 |
| 發明(設計)人: | 羅小婭;李柯 | 申請(專利權)人: | 四川長虹電器股份有限公司 |
| 主分類號: | G06N99/00 | 分類號: | G06N99/00;G06Q30/02 |
| 代理公司: | 四川省成都市天策商標專利事務所 51213 | 代理人: | 秦華云;劉渝 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 擬合 預測模型 銷售 預測模型訓練 歷史數據 算法選擇 問題處理 測試 機器學習 建立模型 建模數據 模型參數 模型規則 模型訓練 數據規則 選擇算法 學習訓練 已知數據 真實業務 種子數據 測試集 正則化 算法 驗證 預測 探索 發現 | ||
1.一種防止銷售預測模型過擬合的方法,其特征在于,具體包含以下步驟:
A.銷售預測模型算法選擇:
A1.對銷售預測業務進行調研分析,梳理銷售預測模型目標,確定業務模型類型及數量、確定目標模型最低精準度;
A2.銷售預測模型算法選擇:根據業務需求及銷售數據特性,以精準度為首要要求配置多種適合的算法;
B.建立業務活動銷售預測模型:
確定選擇的模型算法,從mysql數據庫中獲取建模數據,并在R語言上使用選擇的算法建立銷售預測模型;
C.銷售預測模型訓練及測試:
C1.將已有的歷史數據劃分為訓練集和測試集;
C2.訓練集中包含標注有學習目標的標注數據,通過建立模型的算法學習器分析標注數據的規律嘗試擬合出銷量、銷售額與標注數據之間的函數關系得到目標函數或代價函數;
D.通過測試集對訓練好的銷售預測算法模型進行驗證:
在已經訓練好的銷售預測模型輸入測試集的數據進行模型計算驗證,并把計算結果與實際測試集中結果數據對比,分析模型的過擬合程度;
E.對銷售預測模型的過擬合問題進行處理:
通過使用正則化方法進行目標函數或代價函數優化,在目標函數或代價函數后面加上一個正則項,其中,正則化方法包含L1正則化方法、L2正則化方法,正則項有L1范數和項與L2范數和項兩種;
E1.通過L1正則化方法對目標函數或代價函數進行優化時是在目標函數或代價函數后面加上L1范數和項,L1范數和項的計算公式:
E2.通過L2正則化方法對目標函數或代價函數進行優化時是在目標函數或代價函數后面加上參數的L2范數和項,L2范數和項的計算公式:
上述計算公式中,其中,C0為目標函數或代價函數,n是樣本的個數,λ是正則項系數,w為權重。
2.根據權利要求1所述的一種防止銷售預測模型過擬合的方法,其特征在于,在所述L1正則化方法中,權重w的梯度計算公式為:
其中,sgn(w)表示w的符號;
權重w的更新規則為:。
3.根據權利要求1所述的一種防止銷售預測模型過擬合的方法,其特征在于,在所述L2正則化方法中,權重w的梯度計算公式為:
權重w的更新規則為:
4.根據權利要求1所述的一種防止銷售預測模型過擬合的方法,其特征在于,在所述步驟A2中包含的算法至少有決策樹、隨機森林、神經網絡算法。
5.根據權利要求1所述的一種防止銷售預測模型過擬合的方法,其特征在于,在所述步驟B中從mysql數據庫中獲取的建模數據至少包含銷售數據、工廠數據、市場數據、行業數據、宏觀政策數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川長虹電器股份有限公司,未經四川長虹電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810283548.X/1.html,轉載請聲明來源鉆瓜專利網。





