[發明專利]一種面向多維屬性數據的多層聚類融合機制的設計方法有效
| 申請號: | 201510362392.0 | 申請日: | 2015-06-26 |
| 公開(公告)號: | CN104933444B | 公開(公告)日: | 2019-01-01 |
| 發明(設計)人: | 葉寧;張迎亞;黃海平;沙超;王汝傳 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京知識律師事務所 32207 | 代理人: | 汪旭東 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 灰關聯度 多維屬性 聚類結果 數據對象 多層 融合 預處理 粗糙集理論 歸一化處理 屬性重要性 參考標準 矩陣形式 決策系統 數據指標 相似矩陣 最大概率 決策表 數據集 信息熵 概率 轉化 | ||
本發明公開了一種面向多維屬性數據的多層聚類融合機制的設計方法,該方法包括:步驟1:將數據集轉化成矩陣形式,對數據進行預處理;步驟2:根據數據指標屬性特點提取最優參考標準,并對數據進行歸一化處理;步驟3:計算灰關聯度,生成灰關聯度相似矩陣,然后進行灰關聯度聚類,得到初次聚類結果;步驟4:根據上述步驟3初次聚類結果,采用粗糙集理論建立決策表系統;步驟5:對每個聚類成員計算它在該決策系統的屬性重要性信息熵值;步驟6:對每個聚類成員設置權值;步驟7:根據計算的權值,采用概率方法計算每個數據對象在每個所屬類級別里的概率,從中選擇取值最大概率時所在的類級別,就是該數據對象所屬類級別,得到最終聚類融合結果。
技術領域
本發明涉及一種面向多維屬性數據的多層聚類融合機制的設計方法,屬于數據挖掘技術領域。
背景技術
聚類融合技術應用于分析處理、挖掘數據,并且針對數據的不規律性性和分散性提取有用的知識。聚類融合算法是一種非監督機器學習算法,與監督學習算法不同,不要求事先了解數據集的分布。聚類算法的目的就是將數據劃分成若干類,以揭示這些數據分布的真實情況。而通常一組傳感器節點采集的數據一般具有多種混合屬性,將多種屬性的數據進行聚類融合,避免了單一屬性數據處理的盲區,提高了多源信息處理質量,有利于決策分析。
在灰色理論分析中,灰關聯度是研究數據之間相似度的一種度量方法,其對樣本量大小和樣本有無明顯的分布規律沒有嚴格要求,且計算量較小,可以根據樣本數據得到數據之間的灰關聯度,進而建立灰關聯相似矩陣。灰色關聯聚類實質上是對空間中若干點組成條曲線之間幾何形態的分析與比較,一般認為曲線間幾何形狀越接近參考標準序列,則其與參考標準關聯程度就越高,所屬類別等級也越高。
粗糙集理論是一種處理不確定、不精確、含模糊信息的數學理論方法,該理論已經應用在機器學習、數據挖掘、決策分析等領域。粗糙集理論同模糊集、神經網絡、證據理論等其它理論一起,成為不確定性計算的一個重要分支。當前的聚類融合算法大多不考慮聚類數據對象指標屬性以及聚類成員的質量,本文提出了一種基于灰關聯聚類與粗糙集理論的面向多維屬性數據的加權聚類融合機制。
發明內容
本發明目的在于提供了一種一種面向多維屬性數據的多層聚類融合機制的設計方法,該方法是利用灰色關聯分析與粗糙集理論方面的聚類加權信息處理,來解決面向多維混合屬性數據的聚類融合問題。與目前已研究出來的數據聚類相關方法不同,本發明是一種基于多種混合屬性的聚類融合方法,并且考慮了數據對象的指標屬性與聚類成員質量,通過使用本發明提出的方法可以在一定程度提高整體數據的聚類性能,并判別數據相對于參考標準的優劣級別。
本發明解決其技術問題所采取的技術方案是:一種面向多維屬性數據的多層聚類融合機制的設計方法,該方法采用多層聚類融合的機制。根據數據的指標屬性從分析域數據中提取最優參考標準,把提取的最優參考標準與數據庫中已知的歷史參考標準序列集分別用于計算灰關聯度,然后計算灰關聯相似矩陣,得到灰關聯聚類結果。把聚類成員結果結合粗糙集理論,建立決策信息表,完成對聚類成員的加權融合。針對加權結果采用概率論分別計算其所屬分類級別,并定義數據對象與參考標準序列關聯度越高,則該對象被列的級別越高,在此規定一級類別為最高級別,二級類別、三級類別以此類推。本發明從整體上提高了聚類融合模型的可行性與可靠性,且給出了數據對象的優劣級別。
本發明是通過分析多傳感器信息聚類融合各階段的特點,首先設置閾值,過濾、刪除分析域數據的異常點。基于面向多維混合屬性的信息聚類融合體系結構主要包括四部分:依據指標屬性提取最優參考標準、灰關聯聚類分析、粗糙集理論的應用、概率統計數據級別。
本發明在無線傳感器網絡中,通過一組傳感器節點針對某目標在同一時刻采集不同類型的信息,并對數據信息進行加工處理以提取有價值的知識。由于傳感器節點感知的數據可能會出現缺失、不確定等情況,首先將采集的數據進行預處理,轉化成矩陣格式,然后設置閾值,過濾、刪除異常數據點。然后針對分析域數據進行灰關聯聚類,再由粗糙集理論進行加權決策分析,進而采用概率論方法計算聚類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510362392.0/2.html,轉載請聲明來源鉆瓜專利網。





