[發明專利]一種基于譜聚類算法的選擇性聚類集成方法有效
| 申請號: | 201410096258.6 | 申請日: | 2014-03-14 |
| 公開(公告)號: | CN103995821B | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 徐森;李先鋒;曹瑞;花小朋;徐靜;陳榮 | 申請(專利權)人: | 鹽城工學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙)32204 | 代理人: | 李玉平 |
| 地址: | 224051 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 譜聚類 算法 選擇性 集成 方法 | ||
1.一種基于譜聚類算法的選擇性聚類集成方法,其特征在于,包括以下步驟:
(1)聚類成員生成;
(2)基于譜聚類算法選擇代表成員;
(3)對代表成員進行集成;
(4)結束;
所述基于譜聚類算法選擇代表成員的步驟是:
步驟21計算聚類成員之間的相似度;
步驟22根據步驟21計算出的相似度,使用譜聚類算法對聚類成員聚類;
步驟23根據步驟22獲得的聚類結果,從每個聚類成員集合中各選出一個與該簇中所有其他成員之間的NMI值之和最大的聚類成員作為代表成員;
結束;
基于譜聚類算法選擇代表成員中,所述使用譜聚類算法對聚類成員聚類的步驟是:
步驟221獲取要選出的代表成員個數r0;
步驟222構建圖上的隨機游走對應的轉移概率矩陣Pr,具體求解方法如下:Pr=(Dr)-1Sr,其中Sr是聚類成員之間的相似度矩陣,其元素值在步驟21求得,Dr是對角度矩陣,對角元素
步驟223求解Pr的特征值λ1≥…≥λr,若存在某個序i,使得λi嚴格大于λi+1,則令r=i;否則令r=r0;
步驟224將Pr的前r個最大特征值對應的特征向量按列排放,構建矩陣Ur=[u1…ur];
步驟225使用K均值算法將Ur的行聚為r個聚類成員集合G1,…,Gr;
結束。
2.根據權利要求1所述的基于譜聚類算法的選擇性聚類集成方法,其特征在于,所述聚類成員生成的步驟是:
(1)步驟11獲取聚類成員個數r和聚類個數k,其中r是一個大于1的整數,將聚類個數k設置為數據集包含的真實類別數;
(2)步驟12將控制參數i置初值1;
(3)步驟13判斷控制參數i是否小于或等于聚類成員個數r,是則執行步驟14,否則轉到步驟17;
(4)步驟14隨機生成k個均值向量,作為K均值算法的初始質心,使用K均值算法對數據集進行劃分;
(5)步驟15得到聚類結果P(i)={C1(i),…,Ck(i)};
(6)步驟16將控制參數i加1,然后轉到步驟13;
(7)步驟17構建聚類成員集合P’={P(1),…,P(r)};
(8)結束。
3.根據權利要求2所述的基于譜聚類算法的選擇性聚類集成方法,其特征在于所述對代表成員進行集成的步驟是:
(1)步驟31計算數據點之間的相似度,數據點di和dj的相似度計算如下:Sij=di與dj屬于同一個簇的次數/r;
(2)步驟32使用譜聚類算法對數據集聚類;
(3)結束。
4.根據權利要求2所述的基于譜聚類算法的選擇性聚類集成方法,其特征在于對代表成員進行集成,所述使用譜聚類算法對數據集聚類的步驟是:
(1)步驟321構建圖上的隨機游走對應的轉移概率矩陣P,具體求解方法如下:P=D-1S,其中S是數據點之間的相似度矩陣,其元素值由步驟31求得,D是對角度矩陣,對角元素
(2)步驟322求解P的前k個最大特征值對應的特征向量并按列排放,構建矩陣Vk=[v1…vk];
(3)步驟323使用K均值算法將Vk的行聚為k個簇D1,…,Dk;
(4)結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鹽城工學院,未經鹽城工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410096258.6/1.html,轉載請聲明來源鉆瓜專利網。





