[發(fā)明專利]一種基于商空間理論的K-means聚類方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410037923.4 | 申請(qǐng)日: | 2014-01-26 |
| 公開(公告)號(hào): | CN103810261A | 公開(公告)日: | 2014-05-21 |
| 發(fā)明(設(shè)計(jì))人: | 周紅芳;張國(guó)榮;劉園;郭杰;段文聰;王心怡;何馨依 | 申請(qǐng)(專利權(quán))人: | 西安理工大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 西安弘理專利事務(wù)所 61214 | 代理人: | 李娜 |
| 地址: | 710048*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 空間 理論 means 方法 | ||
1.基于商空間理論的K-means聚類方法,其特征在于,先輸入聚類數(shù)K和數(shù)據(jù)集X,然后對(duì)數(shù)據(jù)集X進(jìn)行聚類,最后輸出聚類結(jié)果。
2.如權(quán)利要求1所述的基于商空間理論的K-means聚類方法,其特征在于,所述對(duì)數(shù)據(jù)集X進(jìn)行聚類包括:
1)初始化聚類數(shù)K,對(duì)數(shù)據(jù)集X進(jìn)行預(yù)處理;
2)對(duì)數(shù)據(jù)集X的每一個(gè)維度進(jìn)行排序,并計(jì)算出初始粒度;
3)控制粒度增長(zhǎng)函數(shù)g(t),使粒度快增長(zhǎng),形成粒度增長(zhǎng)序列;
4)選擇一個(gè)分布稀疏度η最大的維度,對(duì)數(shù)據(jù)集進(jìn)行遍歷,查找當(dāng)前粒度可聚的數(shù)據(jù)點(diǎn)與類簇;重復(fù)進(jìn)行4),直到粒度增長(zhǎng)結(jié)束;
5)在3)產(chǎn)生的粒度增長(zhǎng)序列中,逆序找出最大的可聚粒度,可聚粒度的數(shù)目等于聚類數(shù)K;然后從前一個(gè)粒度開始使用粒度增長(zhǎng)函數(shù)的慢增長(zhǎng)階段,繼續(xù)進(jìn)行4),直到粒度增長(zhǎng)結(jié)束,退出,進(jìn)入6);
6)對(duì)離群點(diǎn),邊界簇,和未劃分的數(shù)據(jù)點(diǎn)進(jìn)行聚類;把這些點(diǎn)劃分到與之最為接近的微簇中;
7)循環(huán)遍歷6)生成的微簇集合,對(duì)每一個(gè)微簇在3)生成的粒度增長(zhǎng)序列中查找可以合并的最小粒度,合并查找到的兩個(gè)微簇;當(dāng)微簇的數(shù)目達(dá)到聚類數(shù)K時(shí),退出循環(huán)。
3.如權(quán)利要求2所述的基于商空間理論的K-means聚類方法,其特征在于,數(shù)據(jù)集X在第j維的分布稀疏度為ηj:
其中x′ij是數(shù)據(jù)點(diǎn)xi在第j維屬性的[0,1]的規(guī)范值,μj是第j維屬性的中心。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學(xué),未經(jīng)西安理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410037923.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種實(shí)現(xiàn)K?means聚類的方法及裝置
- 一種K-means聚類的初值選擇方法
- 基于二次K-Means聚類的室內(nèi)位置指紋定位方法
- 一種基于改進(jìn)K-means聚類算法的缺失數(shù)據(jù)填充方法
- 基于K值估計(jì)的K-Means水下圖像背景分割改進(jìn)算法
- 沉積相邊界識(shí)別方法及裝置
- 一種基于密度Canopy的K-means聚類方法
- 基于并行改進(jìn)的K-means算法的大數(shù)據(jù)文本聚類方法及系統(tǒng)
- 基于K-Means和CART回歸樹的路感模擬方法
- 一種基于K-Means和BP神經(jīng)網(wǎng)絡(luò)的路感模擬方法





