[發明專利]信息粒導向變相動態快速聚類算法在審
| 申請號: | 201710157233.6 | 申請日: | 2017-03-16 |
| 公開(公告)號: | CN108629352A | 公開(公告)日: | 2018-10-09 |
| 發明(設計)人: | 徐楷杰;李志武;聶衛科;朱修彬;尹雨山 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 西安恒泰知識產權代理事務所 61216 | 代理人: | 李鄭建 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 矢量 粒相 快速聚類算法 運算復雜度 平移 參數調整 高維數據 構造信息 壓縮處理 影響算法 標準差 降維 賦予 | ||
本發明公開了一種導向變相動態快速聚類算法,首先對信息粒數據作平移標準差變換,然后構造信息粒相矢量;最后對信息粒相矢量進行聚類;本發明對信息粒數據進行導向壓縮處理,賦予信息粒以相信息,對信息粒相矢量進行聚類,可以使高維數據降維,且通過參數調整可以提高調整聚類性能而不影響算法運算復雜度。使其更快聚類,提高了聚類效果。
技術領域
本發明屬于大數據技術研究領域,具體涉及一種有效的導向變相動態快速聚類算法,以提高聚類性能。
背景技術
在大數據時代,如何充分挖掘出蘊藏于數據資源中的價值正在成為各國 IT業界、學術界和政府共同關注的焦點。數據挖掘中應用最為廣泛的經典聚類算法之一的kmeans算法一直以來倍受學者們的青睞,針對kmeans算法自身的缺陷,如受迭代次數影響、受初始化中心的影響,當處理實際應用領域的復雜高維數據時,將會出現運算量大、收斂速度慢,不穩定的缺陷。
發明內容
針對上述現有技術存在的不足,本發明的目的在于提供一種信息粒導向變相動態快速聚類算法,更快聚類,提高了聚類效果,聚類穩定可調;解決現有的聚類算法運算量大、收斂速度慢,不穩定的缺陷。
為解決上述技術問題,本發明采用了以下技術方案:
一種導向變相動態快速聚類算法,包括以下步驟:
步驟一:對信息粒數據D作平移標準差變換,得到
信息粒數據D為:
變換之后的信息粒數據為:
其中,
xnm表示第n個數據的第m個屬性,x′nm表示經平移標準差變換后的第 n個數據的第m個屬性,N表示信息粒數據的個數,每個數據有M個屬性;
步驟二:構造信息粒相矢量;
步驟2.1:信息粒數據的導向矢量Ξ為:
其中,Ω為信息粒的導向壓縮矢量,Λ為信息粒的導向壓縮變換矢量,Λ=[cosθ1 cosθ2 … cosθm … cosθM]T,且滿足θm表示波長為λ的平行波輻射在信息粒上時該平行波束與M維空間標準正交坐標軸的正向夾角,m=1,2,...,M;
步驟2.2:相矢量Ψ分布在單位圓上,相矢量中每一個元素為信息粒的一個相,相矢量中一個相對應單位圓上的一個點,相矢量Ψ的表達式為:Ψ=ejΞ,其中,
步驟三:對信息粒相矢量進行聚類;
對相矢量Ψ在單位圓上形成的點進行聚類,獲得K個類簇,K>1。
本發明還具有如下區別技術特征:
所述的步驟二至步驟三中,平行波的波長λ為λ≥max(Ω)的變量。
所述的步驟三中,使用K-means聚類算法對相矢量Ψ在單位圓上形成的點進行聚類。
本發明的有益效果:
本發明對信息粒數據進行導向壓縮處理,賦予信息粒以相信息,對信息粒相矢量進行聚類,可以使高維數據降維,且通過參數調整可以提高調整聚類性能而不影響算法運算復雜度。使其更快聚類,提高了聚類效果;聚類穩定可調,更適合實際應用。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710157233.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據模型處理方法及其裝置
- 下一篇:信息粒導向壓縮快速聚類算法





