[發(fā)明專利]一種基于LE算法的工業(yè)監(jiān)測數(shù)據(jù)聚類方法在審
| 申請?zhí)枺?/td> | 201811097330.1 | 申請日: | 2018-09-19 |
| 公開(公告)號: | CN109409407A | 公開(公告)日: | 2019-03-01 |
| 發(fā)明(設(shè)計)人: | 謝國;張永艷;劉涵;王文卿;梁莉莉;張春麗;孫瀾瀾 | 申請(專利權(quán))人: | 西安理工大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 楊洲 |
| 地址: | 710048*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聚類 數(shù)據(jù)聚類 算法 采樣數(shù)據(jù) 工業(yè)監(jiān)測 低維 建模 降維 預(yù)處理 輸出 工業(yè)系統(tǒng) 監(jiān)測數(shù)據(jù) 密度聚類 多變量 計算量 聚類簇 映射 高維 集合 采集 壓縮 保證 發(fā)現(xiàn) | ||
1.一種基于LE算法的工業(yè)監(jiān)測數(shù)據(jù)聚類方法,其特征在于,包括如下步驟:
步驟1、對工業(yè)系統(tǒng)的監(jiān)測數(shù)據(jù)進行采集,并進行預(yù)處理;
步驟2、基于拉普拉斯特征映射LE算法進行建模,將步驟1中的采樣數(shù)據(jù)作為輸入數(shù)據(jù),通過計算并輸出低維數(shù)據(jù);
步驟3、基于密度聚類方法DBSCAN進行建模,步驟2的低維數(shù)據(jù)作為該模型的輸入,對其進行聚類;
步驟4、輸出:聚類后的集合C={C1,C2,…,CK},Co,o=1,2,...,K為聚類之后的第o個聚類簇。
2.根據(jù)權(quán)利要求1所述的一種基于LE算法的工業(yè)監(jiān)測數(shù)據(jù)聚類方法,其特征在于,所述步驟1具體包括如下步驟:
步驟1.1、先對工業(yè)系統(tǒng)進行采樣,并用X={x1,x2,…,xN}∈Rd×N表示,其中d表示數(shù)據(jù)的變量個數(shù),N表示采樣數(shù)目,其中第t個采樣數(shù)據(jù)用xt表示,且t=1,2,...,N,xt=[xt1 xt2... xtd]T;
步驟1.2、對采樣數(shù)據(jù)X進行檢查,如果在X中某個數(shù)據(jù)xtj出現(xiàn)丟失現(xiàn)象,假設(shè)其中xtj為第t個采樣數(shù)據(jù)的第j個變量丟失,則利用公式進行補充,j=1,2,…,d。
3.根據(jù)權(quán)利要求2所述的一種基于LE算法的工業(yè)監(jiān)測數(shù)據(jù)聚類方法,其特征在于,所述步驟2具體包括如下步驟:
步驟2.1、將完整的步驟1的采樣數(shù)據(jù)X作為輸入,低維數(shù)據(jù)的維數(shù)s<d作為輸入?yún)?shù);
步驟2.2、構(gòu)建一個鄰接圖G(V,E):用K最近鄰算法KNN尋找屬于每個數(shù)據(jù)點xt的k個近鄰點,滿足k<N;
步驟2.3、確定權(quán)值矩陣:如果數(shù)據(jù)點xt是數(shù)據(jù)點xi的近鄰點,它的權(quán)值系數(shù)l表示熱核函數(shù)的參數(shù),對于不屬于該數(shù)據(jù)點的近鄰點,則將權(quán)重系數(shù)設(shè)置為零;
步驟2.4、計算對角矩陣D,該矩陣的對角線元素Dii由步驟2.3構(gòu)建的權(quán)值矩陣的第i列所有元素Wti的和,用公式表示為除對角線元素外其余元素全部置零;
步驟2.5、計算拉普拉斯矩陣L:根據(jù)公式L=D-W計算拉普拉斯矩陣;
步驟2.6、通過解決廣義特征值問題,根據(jù)公式Ly=λDy解決該問題并獲得特征值及其特征向量,并提取最小的s個非零特征值及對應(yīng)的特征向量,對應(yīng)的低維數(shù)據(jù)輸出用Y={y1,y2,…,ym}表示,其中yj為對應(yīng)的第j個特征向量,j=1,2,…,m。
4.根據(jù)權(quán)利要求3所述的一種基于LE算法的工業(yè)監(jiān)測數(shù)據(jù)聚類方法,其特征在于,所述步驟3具體包括如下步驟:
步驟2中產(chǎn)生的降維數(shù)據(jù)用Y={y1,y2,…,ym}表示,其中yj為N維向量,對降維后的N個采樣數(shù)據(jù)進行聚類,聚類的目的是將相似性較大的數(shù)據(jù)聚成一類,相似性較小的數(shù)據(jù)分開;
步驟3.1、輸入?yún)?shù)ε和MinPts,分別為聚類半徑和除噪聲點數(shù)據(jù)之外的每類數(shù)據(jù)中的最小數(shù)目;
步驟3.2、尋找核心對象:找出每個數(shù)據(jù)點在ε半徑內(nèi)的數(shù)據(jù)點,如果該半徑內(nèi)的數(shù)據(jù)點的個數(shù)大于等于MinPts時,標記該點為核心對象,反之,為噪聲點數(shù)據(jù);
步驟3.3、以步驟2中的所有核心對象為出發(fā)點,找出其密度可達樣本生成的聚類簇,直到所以核心對象都被訪問停止迭代。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學(xué),未經(jīng)西安理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811097330.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)處理裝置中的時基調(diào)整
- 信號處理方法與設(shè)備以及記錄介質(zhì)
- 數(shù)據(jù)采樣方法以及數(shù)據(jù)采樣裝置
- 一種用于污水處理廠的報表數(shù)據(jù)采樣方法
- 一種多路串行數(shù)據(jù)自適應(yīng)采樣的方法、裝置及電子設(shè)備
- 一種基于實時數(shù)據(jù)流的數(shù)據(jù)采樣方法、裝置及電子設(shè)備
- 寫數(shù)據(jù)采樣信號時序監(jiān)測方法、監(jiān)測電路和存儲器
- 一種數(shù)據(jù)采樣方法及裝置
- 數(shù)據(jù)采樣電路、數(shù)據(jù)采樣裝置
- 數(shù)據(jù)采樣電路、數(shù)據(jù)采樣裝置





