[發(fā)明專利]一種基于數(shù)據(jù)挖掘的污水處理廠進水質(zhì)量預測方法有效
| 申請?zhí)枺?/td> | 202010721271.1 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN111858715B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設計)人: | 于忠清;寇騰躍 | 申請(專利權)人: | 青島洪錦智慧能源技術有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F18/213;G06F18/24;G06N3/048;G06N3/08;G06N3/126;G06Q10/04;G06Q50/26 |
| 代理公司: | 昆明普發(fā)諾拉知識產(chǎn)權代理事務所(特殊普通合伙) 53209 | 代理人: | 葛玉軍 |
| 地址: | 266000 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數(shù)據(jù) 挖掘 污水處理 進水 質(zhì)量 預測 方法 | ||
本發(fā)明公開了一種基于數(shù)據(jù)挖掘的污水處理廠進水質(zhì)量預測方法,涉及水體水質(zhì)預測領域。所述預測方法具體為獲取數(shù)據(jù)后將進水速率的時間戳與碳質(zhì)生化需氧量CBOD、pH值、總懸浮固體TSS的每日濃度值時間戳對齊;將每日平均進水率數(shù)據(jù)作為單變量,15分鐘為間隔獲取的進水率為多變量,建立以進水流量為輸入生成碳質(zhì)生化需氧量CBOD值的擬合模型,補齊缺失的CBOD值;數(shù)據(jù)降維得到預處理數(shù)據(jù)集;將預處理數(shù)據(jù)集按淡旺季進行區(qū)分,淡季數(shù)據(jù)輸入多層神經(jīng)網(wǎng)絡MLP得到淡季CBOD預測模型,旺季數(shù)據(jù)輸入決策樹CRT得到旺季CBOD預測模型。通過數(shù)據(jù)補齊使得用于訓練和測試的數(shù)據(jù)集更為完整,分別建立淡季和旺季的預測模型,使得預測精度更高。
技術領域
本發(fā)明涉及水體水質(zhì)預測領域,具體涉及一種基于數(shù)據(jù)挖掘的污水處理廠進水質(zhì)量預測方法。
背景技術
廢水處理廠主要是將原始進水轉化為有效廢水的過程,而進水水質(zhì)直接影響到對污水處理策略的制定和實時調(diào)整。進水水質(zhì)主要通過碳質(zhì)生化需氧量(CBOD),氫勢(pH)和總懸浮固體(TSS)這三項指標進行測量和評判,這些數(shù)據(jù)無法通過在線傳感器實時測量,現(xiàn)有技術中通常是每周測量兩側或三次,時間間隔太長,無法滿足實時控制的要求。
另一方流入廢水的流速不穩(wěn)定,這也需要有效的控制解決方案。上述指標也具備季節(jié)性的規(guī)律,亟需開發(fā)一種能實時預測進水質(zhì)量的方法,以此為依據(jù)進行污水處理策略的制定和實時調(diào)整。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于數(shù)據(jù)挖掘的污水處理廠進水質(zhì)量預測方法,解決現(xiàn)有技術中難以對進水質(zhì)量進行預測,導致無法實時調(diào)控污水處理的問題。
為解決上述的技術問題,本發(fā)明采用以下技術方案:一種基于數(shù)據(jù)挖掘的污水處理廠進水質(zhì)量預測方法,其特征在于包括如下步驟:
S1、獲取目標數(shù)據(jù):以15分鐘為間隔獲取進水速率,以每周2至3次獲取碳質(zhì)生化需氧量CBOD、pH值、總懸浮固體TSS的每日濃度值;
S2、數(shù)據(jù)集成:將進水速率的時間戳與碳質(zhì)生化需氧量CBOD、pH值、總懸浮固體TSS的每日濃度值時間戳對齊;
S3、補齊數(shù)據(jù):將每日平均進水率數(shù)據(jù)作為單變量,15分鐘為間隔獲取的進水率為多變量,分析單變量和多變量數(shù)據(jù),建立以進水流量為輸入生成碳質(zhì)生化需氧量CBOD值的擬合模型,補齊缺失的碳質(zhì)生化需氧量CBOD值,得到原始數(shù)據(jù)集;
S4、數(shù)據(jù)降維:使用數(shù)據(jù)挖掘算法-Boosting樹和帶有遺傳搜索的wrapper算法,對數(shù)據(jù)進行降維,得到預處理數(shù)據(jù)集;
S5、數(shù)據(jù)拆分及建模:將預處理數(shù)據(jù)集按淡旺季進行區(qū)分,其中1-6月數(shù)據(jù)為淡季數(shù)據(jù),7-12月數(shù)據(jù)為旺季數(shù)據(jù),將對應數(shù)據(jù)中的2/3作為訓練數(shù)據(jù)集,余下的1/3作出測試數(shù)據(jù)集,其中淡季數(shù)據(jù)輸入多層神經(jīng)網(wǎng)絡MLP得到淡季CBOD預測模型,旺季數(shù)據(jù)輸入決策樹CRT得到旺季CBOD預測模型;
S6、模型評估:使用測試數(shù)據(jù)集對預測模型性能進行測試,使用兩個性能評估指標進行評估平均絕對誤差MAE和平均相對誤差MRE,其中:
其中,
其中,
其中,為t時刻的預測值,y(t)為真實值。
更進一步的技術方案是步驟S1中所述的目標數(shù)據(jù)從位于愛荷華州得梅因市的廢水處理廠獲得的,獲取其從2005年1月4日到2010年12月29日的5年間的數(shù)據(jù)記錄。
更進一步的技術方案是步驟S3中所述的補齊數(shù)據(jù)的具體流程如下:
S3-1、對于單變量,將步驟S2中處理后的數(shù)據(jù)三分之二用于訓練,三分之一用于測試;給定訓練數(shù)據(jù),通過曲線擬合確定最佳擬合曲線和對應的方程式;利用遺傳規(guī)劃GP方法對進水流量與碳質(zhì)生化需氧量CBOD之間的數(shù)學關系進行辨識,找到進水流量與碳質(zhì)生化需氧量CBOD之間精確方程;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島洪錦智慧能源技術有限公司,未經(jīng)青島洪錦智慧能源技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010721271.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





