[發明專利]一種基于集成學習的大壩監測數據異常檢測方法在審
| 申請號: | 202011038886.0 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112183624A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 毛鶯池;劉意;王龍寶;李志興;徐淑芳;程楊堃;段云超;孫建英;郭銳;胡奇瑋;孟歡 | 申請(專利權)人: | 河海大學;華能瀾滄江水電股份有限公司;華能集團技術創新中心有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/16;G06F16/903 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 梁耀文 |
| 地址: | 210024 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 集成 學習 大壩 監測 數據 異常 檢測 方法 | ||
1.一種基于集成學習的大壩監測數據異常檢測方法,其特征在于,包括如下步驟:
(1)大壩監測點的集成單元的構造:利用隨機子采樣構造不同的監測數據子集,并根據超參數多樣性構造不同的模型組,訓練得到異常檢測模型池;
(2)偽真值標簽的構造:基于異常檢測模型池,采用集成一致性方法構造測點的偽真值標簽;
(3)測點局部鄰域空間生成:基于鄰域相關性選擇目標測點相關鄰域,根據測點鄰域的異常得分矩陣與從測點的偽真值標簽間的皮爾遜相關性,選擇最優模型組合;
(4)測點異常情況判斷:計算測點在最優模型組合上的得分,判斷測點異常情況。
2.根據權利要求1所述的一種基于集成學習的大壩監測數據異常檢測方法,其特征在于,所述步驟(1)中集成單元構造的具體步驟如下:
(1.1)劃分測點:在T0~T1時間段內,將大壩監測點劃分為訓練測點和測試測點;訓練測點表示有n個訓練測點,每個測點有溫度、水位,滲流量等d個特征,構成d維特征空間;測試測點表示有m個測試測點;
(1.2)構造模型池:對同一異常檢測模型C,使用R組不同的超參數,每一組超參數得到一個異常監測模型C′i;組合模型C′i得到模型池C′={C′1,...,C′i,...,C′R},其中R表示模型池中模型的個數,C′i表示第i組超參數初始化的模型。
(1.3)集成單元的訓練:利用訓練測點分別訓練模型池C′中的所有R個模型,得到訓練好的模型池C={C1,...,Ci,...,CR}。
3.根據權利要求2所述的一種基于集成學習的大壩監測數據異常檢測方法,其特征在于,所述步驟(2)中構造偽真值標簽的具體步驟如下:
(2.1)利用步驟(1)訓練好的模型池,計算測點的異常得分矩陣;輸入為的下采樣子集,輸出為異常得分矩陣,表示為:Ci(xtrain)表示訓練測點在第i個模型上的異常得分;更具體的表示為:
其中表示第i個訓練測點;
(2.2)根據步驟(2.1)得到的異常得分矩陣,將訓練測點在所有R個模型上的輸出結果進行組合,可以得到第i個訓練測點的偽真值標簽;表示為:其中Combine代表組合函數,通常取得分組合最大值;
(2.3)對于每一個訓練測點進行步驟(2.2)的操作,得到所有n個訓練測點的偽真值標簽
4.根據權利要求3所述的一種基于集成學習的大壩監測數據異常檢測方法,其特征在于,所述步驟(3)生成測試測點的局部空間具體步驟如下:
(3.1)考慮第j個測試測點的局部異常,隨機選取測試測點d維特征空間的特征子空間,特征子空間維數一共選取t組,構成了t組特征子空間;
(3.2)對于選取的第i組特征子空間,在m個測試測點中找出在該組特征子空間中,且與測試測點的歐式距離最近的k個鄰居測點,k個鄰居測點的集合表示為KNNi;重復t次,得到在t組特征子空間中的鄰居測點集合,表示為KNN=[KNN1,...,KNNi,...,KNNt];
(3.3)對于測點的局部鄰域空間ψj,初始化為空,即ψj=[];在m個測試測點中,當某個測點在的鄰居測點集合KNN中,且出現的次數大于則將該測點加入的局部鄰域空間ψj,即否則,舍去該測點,即ψj=[];重復m次,得到測點的局部鄰域空間ψj。
5.根據權利要求4所述的一種基于集成學習的大壩監測數據異常檢測方法,其特征在于,所述步驟(4)測點異常情況判斷具體步驟如下:
(4.1)根據步驟(3)中得到的測試測點的局部鄰域空間ψj,利用訓練好的模型池C={C1,C2,...,CR},根據步驟(2.1)的方法,得到的局部空間異常得分矩陣:其中|ψj|是局部空間ψj的基;假設局部空間ψj中包含10個訓練測點,則ψj=[ψj1,ψj2,...,ψj10],ψji表示局部空間ψj中的第i個測點;則O(ψj)具體表示為:
其中,ψji表示局部空間ψj中的第i個測點;
(4.2)根據(4.1)中生成的的局部空間異常得分矩陣O(ψj),得到的局部偽真值標簽:其中Combine代表組合函數,通常取得分組合最大值;
(4.3)計算的局部異常得分矩陣與的局部偽標簽之間的皮爾遜相關系數。通過比較相關系數的大小,選擇出與局部偽標簽最相似的L個模型;表示為:D=[D1,...,Di,...,DL],其中Di∈C;
(4.4)根據選擇的L個模型,計算該測試測點的異常分數;將L個模型異常得分的最大值最為測點的最終異常分數scorej;即其中
(4.5)異常測點判斷:設置閾值threshold,當scorej<threshold時,表示為正常測點;當scorej≥threshold時,表示為異常測點;
(4.6)對測試測點中的所有測點執行(3)(4)步操作,檢測出所有測試測點中的所有異常測點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學;華能瀾滄江水電股份有限公司;華能集團技術創新中心有限公司,未經河海大學;華能瀾滄江水電股份有限公司;華能集團技術創新中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011038886.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種顧及物侯信息的植被冠層蒸騰反演方法
- 下一篇:一種基于馬術運動的發電裝置





