[發(fā)明專利]一種基于大數(shù)據(jù)的用水量預(yù)測(cè)方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201811383557.2 | 申請(qǐng)日: | 2018-11-20 |
| 公開(kāi)(公告)號(hào): | CN109636007A | 公開(kāi)(公告)日: | 2019-04-16 |
| 發(fā)明(設(shè)計(jì))人: | 姜春濤;侯菁菁;馮櫻;于輝;吳志煒;楊志鵠;黃穎欣;黃鋼忠 | 申請(qǐng)(專利權(quán))人: | 佛山科學(xué)技術(shù)學(xué)院 |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06Q50/06;G06K9/62 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 朱繼超 |
| 地址: | 528000 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用水量 預(yù)測(cè) 大數(shù)據(jù) 主成分回歸模型 回歸預(yù)測(cè)模型 主成分分析法 預(yù)處理 數(shù)據(jù)預(yù)處理 支持向量機(jī) 主成分分析 回歸模型 輸入采集 特征選取 影響因素 預(yù)測(cè)技術(shù) 預(yù)測(cè)結(jié)果 預(yù)測(cè)模型 數(shù)據(jù)集 算法 套用 篩選 | ||
本發(fā)明涉及用水量預(yù)測(cè)技術(shù)領(lǐng)域,具體涉及一種基于大數(shù)據(jù)的用水量預(yù)測(cè)方法及裝置,輸入采集的數(shù)據(jù),并使用主成分分析法以及Lasso特征選取模型進(jìn)行數(shù)據(jù)預(yù)處理;通過(guò)建立各地區(qū)年度用水量預(yù)測(cè)模型,根據(jù)預(yù)處理的數(shù)據(jù)得出用水量預(yù)測(cè)結(jié)果,本公開(kāi)采用主成分回歸模型、Lasso回歸模型和支持向量機(jī)回歸預(yù)測(cè)模型三種模型相結(jié)合,在使用了主成分分析之后再套用lasso算法進(jìn)一步對(duì)主成分進(jìn)行篩選,降低了對(duì)因子質(zhì)量的要求,相比于現(xiàn)有的技術(shù),本發(fā)明只需要收集較少的影響因素?cái)?shù)據(jù)集就可以求出精確度高的用水量,大幅度提高用水量的預(yù)測(cè)精度的同時(shí)在更短的時(shí)間內(nèi)預(yù)測(cè)出用水量。
技術(shù)領(lǐng)域
本發(fā)明涉及用水量預(yù)測(cè)技術(shù)領(lǐng)域,具體涉及一種基于大數(shù)據(jù)的用水量預(yù)測(cè)方法及裝置。
背景技術(shù)
由于人口過(guò)多,用水的速度遠(yuǎn)遠(yuǎn)快于環(huán)境的自凈速度,從而導(dǎo)致淡水資源匱缺,被列入不可再生資源。隨著經(jīng)濟(jì)的快速發(fā)展,城鄉(xiāng)居民的生產(chǎn)用水和居民用水的需求越來(lái)越大,使得水量預(yù)測(cè)工作成為水資源管理中掌握未來(lái)發(fā)展趨勢(shì)的關(guān)鍵。而合理的預(yù)測(cè)城鄉(xiāng)規(guī)劃期限內(nèi)的用水量,使其與城鄉(xiāng)發(fā)展實(shí)際相接近,對(duì)城鄉(xiāng)今后的建設(shè)和發(fā)展具有極其重要的意義。通過(guò)預(yù)測(cè)未來(lái)的用水量,一方面,我們可以大致估計(jì)城市和農(nóng)村的缺水量,著手尋求解決方案,實(shí)現(xiàn)水資源的合理調(diào)度,減少經(jīng)濟(jì)損失。另一方面,用水量預(yù)測(cè)是水資源管理規(guī)劃的重要內(nèi)容。如不做好用水量預(yù)測(cè),我國(guó)就難以制定中長(zhǎng)期水資源開(kāi)發(fā)利用的總體規(guī)劃和供水規(guī)劃,就會(huì)影響國(guó)民經(jīng)濟(jì)計(jì)劃的實(shí)現(xiàn)。
現(xiàn)有的技術(shù)中只單一地采用主成分分析法對(duì)特征進(jìn)行選取,選取貢獻(xiàn)值達(dá)到一定程度的影響因素來(lái)進(jìn)行預(yù)測(cè),這樣的做法雖然比起原始的做法方便快捷許多,但是當(dāng)影響因素絕大部分與因變量關(guān)系比較密切時(shí),通過(guò)主成分分析法篩選出來(lái)的特征仍然很多,這樣的話,就不能達(dá)到想要通過(guò)該方法使得運(yùn)算量減少的效果。
對(duì)一個(gè)事件結(jié)果的預(yù)測(cè)具有高貢獻(xiàn)值的影響因素往往有很多,若只依靠主成分分析法來(lái)縮小影響因素選取范圍,這無(wú)疑對(duì)減少計(jì)算負(fù)擔(dān)起不了多大的作用。
1996年Robert Tibshirani首次提出LASSO算法,全稱Least absolute shrinkageand selection operator,譯為最小絕對(duì)值收斂和選擇算子、套索算法,該方法是一種壓縮估計(jì),它通過(guò)構(gòu)造一個(gè)懲罰函數(shù)得到一個(gè)較為精煉的模型,使得它壓縮一些系數(shù),同時(shí)設(shè)定一些系數(shù)為零,因此保留了子集收縮的優(yōu)點(diǎn),是一種處理具有復(fù)共線性數(shù)據(jù)的有偏估計(jì)。
在運(yùn)用主成分分析法的基礎(chǔ)上,再套用lasso算法,可以顯著提高預(yù)測(cè)精度;主成分跟lasso相結(jié)合本質(zhì)上就是原本因子的線性組合,如果原本因子取值幅度差不多,產(chǎn)生的主成分哪怕幅度不同,也可以進(jìn)行一定的壓縮,使之幅度差不多,但方向不變,所以還是垂直的;然后就可以用這些主成分進(jìn)行回歸,再套用lasso把系數(shù)取值小的刪掉,這樣效果會(huì)更好,因?yàn)檫@進(jìn)一步降低了對(duì)因子質(zhì)量的要求。
而如何結(jié)合現(xiàn)有技術(shù)更加精準(zhǔn)高效地預(yù)測(cè)用水量成為值得深入研究的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明提供一種基于大數(shù)據(jù)的用水量預(yù)測(cè)方法及裝置,能夠大幅度提高用水量的預(yù)測(cè)精度的同時(shí)在更短的時(shí)間內(nèi)預(yù)測(cè)出用水量。
本發(fā)明提供的一種基于大數(shù)據(jù)的用水量預(yù)測(cè)方法,其特征在于,所述用水量預(yù)測(cè)方法包括以下步驟:
步驟S1、輸入采集的數(shù)據(jù);
步驟S2、使用主成分分析法以及Lasso特征選取模型進(jìn)行數(shù)據(jù)預(yù)處理;
步驟S3、建立各地區(qū)年度用水量預(yù)測(cè)模型;
步驟S4、得出用水量預(yù)測(cè)結(jié)果。
進(jìn)一步,所述步驟S1具體通過(guò)選取具有代表性的因素xj作為采集的數(shù)據(jù),令j=14,則包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于佛山科學(xué)技術(shù)學(xué)院,未經(jīng)佛山科學(xué)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811383557.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于大數(shù)據(jù)平臺(tái)的網(wǎng)絡(luò)安全實(shí)施系統(tǒng)及方法
- 基于事件驅(qū)動(dòng)的智慧城市大數(shù)據(jù)體系及處理方法
- 一種大數(shù)據(jù)應(yīng)用開(kāi)發(fā)的系統(tǒng)及方法
- 家用設(shè)備報(bào)告的生成方法、大數(shù)據(jù)系統(tǒng)和存儲(chǔ)介質(zhì)
- 一種基于計(jì)算機(jī)大數(shù)據(jù)的平臺(tái)架構(gòu)
- 一種大數(shù)據(jù)處理系統(tǒng)
- 面向工業(yè)4.0的時(shí)空大數(shù)據(jù)分布式存儲(chǔ)檢索方法及系統(tǒng)
- 一種聯(lián)網(wǎng)式醫(yī)療大數(shù)據(jù)分級(jí)傳輸方法及系統(tǒng)
- 一種大數(shù)據(jù)信息監(jiān)控方法、裝置及計(jì)算機(jī)設(shè)備
- 一種知識(shí)產(chǎn)權(quán)大數(shù)據(jù)情報(bào)檢索系統(tǒng)
- 一種基于集成正交成分最優(yōu)化回歸分析的軟測(cè)量方法
- 一種果品蔬菜生長(zhǎng)的影響因素的調(diào)控方法和系統(tǒng)
- 一種天然氣用氣量的預(yù)測(cè)方法及裝置
- 基于物聯(lián)網(wǎng)的金融貸后監(jiān)管系統(tǒng)與監(jiān)管方法
- 一種基于局部主成分分析的人臉關(guān)鍵點(diǎn)檢測(cè)方法及系統(tǒng)
- 基于K-means和主成分線性回歸的臺(tái)區(qū)線損率影響因素分析方法
- 大氣氣溶膠數(shù)據(jù)預(yù)測(cè)方法
- 基于主成分分析和logistic回歸的電纜老化狀態(tài)評(píng)估方法和裝置
- 一種煙絲結(jié)構(gòu)預(yù)測(cè)模型的構(gòu)建方法和裝置
- 一種基于核主成分回歸的工業(yè)過(guò)程故障檢測(cè)方法及系統(tǒng)





