[發明專利]基于Self-tuning的局部密度譜聚類相似度量算法在審
| 申請號: | 201410498330.8 | 申請日: | 2014-09-25 |
| 公開(公告)號: | CN104318241A | 公開(公告)日: | 2015-01-28 |
| 發明(設計)人: | 陳雷霆;蔡洪斌;邱航;關亞勇;曹躍;崔金鐘;盧光輝 | 申請(專利權)人: | 東莞電子科技大學電子信息工程研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都中亞專利代理有限公司 51126 | 代理人: | 何淵 |
| 地址: | 523010 廣東省東莞市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 self tuning 局部 密度 譜聚類 相似 度量 算法 | ||
1.一種基于Self-tuning的局部密度譜聚類相似度量算法,其特征在于,該方法包括如下步驟:
(1)假設對于N維的數據集S={s1,s2,...,sM}∈RM×N,其樣本個數為M,每一個樣本si為N維數據點,其真實的聚類數目為C;將數據集S進行歸一化處理,使得特征數據歸一化到[0,1]之間,去除數據特征之間數量級的影響;
(2)計算數據集S所有數據點對之間的歐式距離,表示為{d1,d2,...,dn(n-1)/2};
(3)根據步驟(2)求取的歐式距離d計算表示局部密度的半徑ε的值,該值滿足數據點的平均鄰居數是總數據數的2%-3%;
(4)根據公式σi=d(si,sk)計算數據集S中每一個數據點si的局部尺度σi,其中k的取值為2;
(5)將步驟(3)中計算的半徑ε和步驟(4)中計算的局部尺度σ帶入公式
(6)定義對角矩陣D,使得即對角陣D主對角線元素值為相似矩陣A每一行元素的行和,其余元素值為0;
(7)根據對角陣D和相似矩陣求解歸一化的拉普拉斯矩陣L,其中L=D-1/2(D-A)D-1/2;
(8)求解拉普拉斯矩陣L的前C個最小的特征值對應的特征向量,組成新的特征向量空間X={x1,x2,...,xM}∈RM×C,其中每一列對應一個特征向量;
(9)對特征向量空間X進行歸一化的處理,得到新的特征向量空間Y={y1,y2,...,yM}∈RM×C,其中
(10)將Y的每一行看作一個樣本數據點,對Y進行K-means聚類,將Y劃分為C個類別,C={C1,C2,...,CC};
(11)將原數據集S的每一行和Y的每一行對應,如果yi屬于類Ci,則si也屬于類Ci,這樣就將數據集S劃分為C個類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東莞電子科技大學電子信息工程研究院,未經東莞電子科技大學電子信息工程研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410498330.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:太陽能板模塊和組件
- 下一篇:一種基于計算機視覺的花蕾判別方法





