[發明專利]流域水質預測方法和裝置、計算機可讀存儲介質在審
| 申請號: | 202011321750.0 | 申請日: | 2020-11-23 |
| 公開(公告)號: | CN112684130A | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 李震;孫鋒;黃紅杉 | 申請(專利權)人: | 深圳市水務科技有限公司 |
| 主分類號: | G01N33/18 | 分類號: | G01N33/18;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 黃廣龍 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 流域 水質 預測 方法 裝置 計算機 可讀 存儲 介質 | ||
本公開實施例提供流域水質預測方法和裝置、計算機可讀存儲介質,屬于水質預測領域。流域水質預測方法,包括:獲取流域的樣本數據集;對所述流域的樣本數據集進行獨熱碼預處理,得到預處理后的中間樣本數據;將所述中間樣本數據輸入至預設的目標預測模型;通過所述目標預測模型對所述中間樣本數據進行預測,得到目標水質數據,本公開實施例只需要構建目標預測模型,不需要構建多個模型,降低了構建模型的成本,并提高了預測水質數據的準確性。
技術領域
本發明涉及計算機領域,尤其涉及流域水質預測方法和裝置、計算機可讀存儲介質。
背景技術
流域水質預測方法通常使用機器學習算法,例如KNN、線性回歸、邏輯回歸、支持向量機等,能滿足部分需求。但機器學習算法受限于其輸入數據類型的要求,只能是數值類型,在這樣的前提下,對流域水質影響權重較大的文本型數據不能進行處理;另外,流域環境復雜,很難找到一種算法較能好地擬合流域水質預測的需求,通用的方法利用常見的機器學習算法建立多個模型,比較麻煩和復雜。
發明內容
本公開實施例的主要目的在于提出一種流域水質預測方法和裝置、計算機可讀存儲介質,以降低構建預測模型的成本、提高預測水質數據的準確性。
為實現上述目的,本公開實施例的第一方面提出了一種流域水質預測方法,包括:
獲取流域的樣本數據集;
對所述流域的樣本數據集進行獨熱碼預處理,得到預處理后的中間樣本數據;
將所述中間樣本數據輸入至預設的目標預測模型;
接收所述預測模型根據所述中間樣本數據預測出的目標水質數據。
在一些實施例中,所述流域的樣本數據集包括文本數據,所述對所述流域的樣本數據集進行獨熱碼預處理,得到預處理后的中間樣本數據,包括:
獲取所述文本數據;
獲取歷史數據;
根據所述文本數據對所述歷史數據進行獨熱碼編碼預處理,得到所述中間樣本數據。
在一些實施例中,所述文本數據包括天氣數據。
在一些實施例中,對所述流域的樣本數據集進行清洗處理,得到清洗后的流域中間數據;其中,將所述清洗后的流域中間數據作為進行所述獨熱碼預處理的數據。
在一些實施例中,所述流域中間數據至少包括以下數據之一:空值數據、重復數據、異常范圍數據、通過天氣接口獲取到的外部數據,所述對所述流域中間數據進行清洗處理,得到清洗后的流域中間數據,至少包括以下步驟之一:
對所述空值數據進行清洗處理,得到所述清洗后的流域中間數據;
對所述重復數據進行清洗處理,得到所述清洗后的流域中間數據;
對所述異常范圍數據進行清洗處理,得到所述清洗后的流域中間數據;
對所述外部數據進行清洗處理,得到所述清洗后的流域中間數據。
在一些實施例中,所述中間樣本數據包括樣本水質數據,所述方法還包括:構建所述目標預測模型,具體包括:
根據所述樣本水質數據構建初始預測模型;
將所述樣本水質數據輸入至所述初始預測模型進行訓練,得到所述目標預測模型。
在一些實施例中,所述中間樣本數據還包括測試水質數據,所述方法還包括:根據所述測試水質數據對所述目標預測模型進行評估。
在一些實施例中,所述方法還包括:
將所述目標預測模型部署至應用平臺,所述應用平臺至少為以下之一:應用數據庫或者應用管理平臺。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市水務科技有限公司,未經深圳市水務科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011321750.0/2.html,轉載請聲明來源鉆瓜專利網。





