[發明專利]大數據量預測的三層聯合動態選擇最優模型方法有效
| 申請號: | 201610638099.7 | 申請日: | 2016-08-04 |
| 公開(公告)號: | CN106257506B | 公開(公告)日: | 2018-02-13 |
| 發明(設計)人: | 吳冬華;胡曼恬;胡岳;閆興秀 | 申請(專利權)人: | 南京華蘇科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 江蘇縱聯律師事務所32253 | 代理人: | 戴勇 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據量 預測 三層 聯合 動態 選擇 最優 模型 方法 | ||
1.一種大數據量預測的三層聯合動態選擇最優模型方法,其特征在于:包括預測模型算法庫、權重算法庫、最優權重算法甄選算法三層,預測模型算法庫放置在最底層,在預測模型算法庫之上是權重算法庫,在權重算法庫之上是最優權重算法甄選算法;
預測模型算法庫:包含若干種預測模型算法,這些算法被抽象成共同的接口,放置在聯合算法的最底層,提供預測功能,支撐更上層的功能;
權重算法庫:對預測模型算法庫的最底層算法的多樣性進行屏蔽,根據底層算法的預測結果,按若干種標準對底層算法進行甄選組合,形成若干種權重算法;
最優權重算法甄選算法:根據驗證集中權重算法的效果,選擇最優的權重算法,進行預測;
預測模型算法庫具體的實現步驟如下:
輸入訓練數據;對訓練數據預處理后,得到待用數據;
使用兩種以上的不同算法對待用數據進行模型擬合,得到各待選模型;
對訓練數據預處理,具體包括:
數據篩選:去除過于稀疏的數據列;
時間格式的處理:將時間列映射為連續的整數;
數據補值:缺失數據插值、錯誤數據插值;
權重算法采用如下算法:
算法一:給予所有預測模型相同的權重;
算法二:剔除百分之二十預測結果相對較差的模型,并給予剩下的模型相同的權重;
算法三:計算各模型誤差均方根,然后根據誤差均方根大小,設計一個反趨勢的函數,并根據該函數給各模型賦予權重;
算法四:計算各模型最小絕對誤差,然后根據最小絕對誤差大小,設計一個反趨勢的函數,并根據該函數給各模型賦予權重;
算法五:計算各模型最小二乘計算的誤差,然后根據最小二乘計算的誤差大小,設計一個反趨勢的函數,并根據該函數給各模型賦予權重;
算法六:計算各模型赤池信息量準則,然后根據赤池信息量準則大小,設計一個反趨勢的函數,并根據該函數給各模型賦予權重。
2.如權利要求1所述的大數據量預測的三層聯合動態選擇最優模型方法,其特征在于,預測模型算法庫具體的實現步驟如下:
調用預測模型庫,得到預測模型的預測數據集;
分別調用各個權重算法,并計算權重;
賦予各預測模型相應權重,進行數據預測,存儲預測的數據。
3.如權利要求1所述的大數據量預測的三層聯合動態選擇最優模型方法,其特征在于,最優權重算法依據各權重算法在測試集上的預測效果,來甄選最優權重算法;最優權重算法甄選算法的具體步驟如下:
調用權重算法庫的算法,得到權重預測的數據的集合;
利用權重庫預測的數據集,與驗證集比對,得到誤差;
由最小誤差,得到最優權重算法;
將最優權重方法預測的數據存儲,得到預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京華蘇科技有限公司,未經南京華蘇科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610638099.7/1.html,轉載請聲明來源鉆瓜專利網。





