[發明專利]一種水質污染預警方法及裝置在審
| 申請號: | 202110232689.0 | 申請日: | 2021-03-02 |
| 公開(公告)號: | CN112861770A | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 劉書明;吳雪 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G01N33/18 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 任巖 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 水質 污染 預警 方法 裝置 | ||
1.一種水質污染預警方法,其特征在于,包括:
采集水質參數歷史數據,構建水質污染預警特征庫;
采集待檢測時刻的水質參數數據,構建待檢測時刻水質特征向量,并將該待檢測時刻水質特征向量與所述水質污染預警特征庫共同構成待檢測樣本集;
采用孤立森林算法對該待檢測樣本集中水質參數數據進行異常識別與預警。
2.根據權利要求1所述的水質污染預警方法,其特征在于,所述采集水質參數歷史數據,構建水質污染預警特征庫,包括:
步驟A1:采集t時刻及其前k個時刻的所有水質參數歷史數據,計算t時刻n個水質參數數據間的相關系數、n個水質參數歷史數據從t-k時刻到t時刻共k+1個數據的均值,構建t時刻的水質特征向量,記為實現數據特征的提取和特征向量的構建;
步驟A2:按照步驟A1將包含m個時刻的水質參數歷史數據構建為包含m-k個水質特征向量的水質污染預警特征庫。
3.根據權利要求2所述的水質污染預警方法,其特征在于,步驟A1中所述相關系數為皮爾遜相關系數、斯皮爾曼相關系數、肯德爾相關系數或協方差中任意一個。
4.根據權利要求3所述的水質污染預警方法,其特征在于,所述相關系數為皮爾遜相關系數,則皮爾遜相關系數r采用如下公式計算:
式中,xi和yi分別代表不同天相同時刻的數據,和分別代表不同天相同時段內數據的均值,n為某時段內數據的個數;r的取值范圍為[-1,1],r大于或小于零,均表明兩個水質參數具有一定的協同反饋現象,且r的絕對值越大,協同反饋現象越明顯。
5.根據權利要求2所述的水質污染預警方法,其特征在于,所述采集待檢測時刻的水質參數數據,構建待檢測時刻水質特征向量,并將該待檢測時刻水質特征向量與所述水質污染預警特征庫共同構成待檢測樣本集的步驟中,按照步驟A1構建待檢測時刻水質特征向量,該待檢測時刻水質特征向量為待檢測樣本,將該待檢測樣本與所述水質污染預警特征庫共同構成待檢測樣本集。
6.根據權利要求5所述的水質污染預警方法,其特征在于,所述采用孤立森林算法對該待檢測樣本集中水質參數數據進行異常識別與預警,包括:
步驟1:有放回地從ns個檢測樣本集中抽取ψ個樣本,構建數據子集,其中ns=m-k+1;
步驟2:隨機選擇數據子集中的一個屬性,屬性即檢測樣本集中的任意一列;
步驟3:隨機選擇該屬性的一個值Value;
步驟4:根據所選屬性,使用具有二叉樹結構的iTree對每個數據樣本進行分割,若數據樣本x小于Value,則將其放入左子樹,否則將其放入右子樹;
步驟5:重復步驟3和步驟4,遞歸地構造左子樹和右子樹,直至所有葉子節點均只有一個數據樣本,即數據樣本無法再被分割,iTree停止生長;
步驟6:重復步驟1~5,構建nt棵iTree,形成iForest;
步驟7:計算每個數據樣本在nt棵iTree中的平均路徑長度和該平均路徑長度的p分位數,若待檢測樣本的平均路徑長度大于該平均路徑長度的p分位數,則水質異常,否則水質正常。
7.根據權利要求6所述的水質污染預警方法,其特征在于,步驟7中所述的平均路徑長度的p分位數與平均路徑長度及采樣大小有關,假設數據樣本x在一棵iTree上的路徑長度為h(x),在nt棵iTree上的平均路徑長度為E(h(x)),則數據樣本x的p分位數s(x,ψ)為:
公式(3)中的H(ψ-1)為調和數,H(ψ-1)=ln(ψ-1)+0.5772156649,E(h(x))越接近于0,s(x,ψ)越接近于1,數據樣本越易被判定為異常。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110232689.0/1.html,轉載請聲明來源鉆瓜專利網。





