[發明專利]一種密度峰值聚類的工業過程數據聚類方法有效
| 申請號: | 201810217551.1 | 申請日: | 2018-03-15 |
| 公開(公告)號: | CN108537249B | 公開(公告)日: | 2020-05-19 |
| 發明(設計)人: | 鄭英;陳斌;汪上曉;張洪 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智;曹葆青 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 密度 峰值 工業 過程 數據 方法 | ||
1.一種密度峰值聚類的工業過程數據聚類方法,其特征在于,包括:
(1)獲取工業過程數據,包括正常數據、故障數據和不同模態的數據,組成數據集;將數據集中數據之間的歐氏距離與時間因數相結合,得到數據之間的距離;
(2)根據數據之間的距離和調節參數,得到截斷距離,根據截斷距離和數據之間的距離,得到每個數據的局部密度,計算每個數據與比它的局部密度大的數據之間的最小距離;
(3)對數據集中每個數據的局部密度與最小距離的乘積排序,取乘積較大的前H個數據為聚類中心,比聚類中心的局部密度大的數據中距離聚類中心最近的數據與聚類中心屬于同一類;
(4)對于數據集中沒有類屬性的數據按照局部密度從大到小的順序判斷其類屬性,對于沒有類屬性的數據中的任意一個數據,該數據與比它的局部密度大的數據中距離它最近的數據屬于同一類,進而得到工業過程數據的聚類結果;
所述步驟(1)中數據之間的距離為:d’ij=dij+tij,其中,d’ij為數據i與數據j之間的距離,dij為數據i與數據j之間的歐氏距離,tij為數據i與數據j之間時間因數,tij=λ(i-j)a,其中,sk是第k個變量的標準差,1≤k≤n,n為數據的變量總數,xik-xjk為數據i與數據j之間對應的變量之差,λ為時間因數調節參數。
2.如權利要求1所述的一種密度峰值聚類的工業過程數據聚類方法,其特征在于,其特征在于,所述時間因數調節參數λ的范圍為0.2至5。
3.如權利要求1所述的一種密度峰值聚類的工業過程數據聚類方法,其特征在于,其特征在于,所述步驟(2)還包括:
將數據之間的距離按照降序排列成序列sda(d’1,d’2,…,d’M),其中,N表示數據總數,d’M為序列中第M個數據之間的距離。
4.如權利要求3所述的一種密度峰值聚類的工業過程數據聚類方法,其特征在于,其特征在于,所述截斷距離為:
dc=sda[round(N×(N-1)×p)]
其中,dc為截斷距離,sda[round(N×(N-1)×p)]表示序列中第round(N×(N-1)×p)個數據之間的距離,round表示四舍五入,p為調節參數。
5.如權利要求1或4所述的一種密度峰值聚類的工業過程數據聚類方法,其特征在于,其特征在于,所述調節參數為0.1%至5%。
6.如權利要求4所述的一種密度峰值聚類的工業過程數據聚類方法,其特征在于,其特征在于,所述局部密度為:ρi=∑jχ(d’ij-dc),其中ρi為數據i的局部密度。
7.如權利要求4所述的一種密度峰值聚類的工業過程數據聚類方法,其特征在于,其特征在于,所述最小距離為:
其中,δi為數據i與比它的局部密度大的數據之間的最小距離。
8.如權利要求1或2所述的一種密度峰值聚類的工業過程數據聚類方法,其特征在于,其特征在于,所述工業過程數據聚類方法還包括:
(5)對于新的工業過程數據,計算新的工業過程數據與數據集中每個數據之間的歐氏距離與時間因數相結合,得到新的數據之間的距離;根據新的數據之間的距離和調節參數,得到新的截斷距離,根據新的截斷距離和新的數據之間的距離,得到新的數據的局部密度,計算新的數據與比它的局部密度大的數據之間的新的最小距離;新的工業過程數據與數據集中比新的數據的局部密度大且與新的數據的最小距離相等的數據屬于同一類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810217551.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種腔鏡視野定位評分方法
- 下一篇:一種目標跟蹤模型構建方法及裝置





