[發明專利]基于密度的加權模糊C-均值聚類方法在審
| 申請號: | 202110471176.5 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113010907A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 李媛潔;萬靜;王言言 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150080 黑龍江省哈*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 密度 加權 模糊 均值 方法 | ||
1.一種基于密度的加權模糊C-均值聚類方法,主要包括以下步驟:
步驟一:先使用基于密度的方法計算數據集D中的每個數據對象的局部密度。
步驟二:計算數據集D中的每個數據對象的K-最近鄰。
步驟三:計算數據集D中數據對象的密度平均值。
步驟四:使用KL距離計算數據集D中數據對象的相似度。
步驟五:構造加權模糊C-均值聚類方法的目標函數,并得到隸屬度函數以及聚類中心,完成聚類。
2.根據權利要求書1中所述的一種基于密度的加權模糊C-均值聚類方法,對數據集D={x1,x2,…,xn}∈RS,計算每個數據對象xi的局部密度,局部密度的計算公式為:將計算得到的局部密度按照從小到大的順序進行排序,選取局部密度最大的點,作為初始聚類中心。
3.根據權利要求書1中所述的一種基于密度的加權模糊C-均值聚類方法,計算每個數據對象xi的K-最近鄰,數據對象xi的K-最近鄰表示該數據對象對其他數據對象的距離中最近的K個點,K-最近鄰的計算公式為:
KNNK(xi)={pj∈X|index_dist(xi,xj)≤k}
4.根據權利要求書1中所述的一種基于密度的加權模糊C-均值聚類方法,根據K-最近鄰計算其密度平均值,公式為:
5.根據權利要求書1中所述的一種基于密度的加權模糊C-均值聚類方法,比較K-最近鄰的值與密度的平均值的大小,如果K-最近鄰的值大于密度的平均值,則保留簇中的數據,否則,將該數據對象從所屬的簇中刪除。
6.根據權利要求書1中所述的一種基于密度的加權模糊C-均值聚類方法,計算每個數據對象的KL-距離,來判斷它們之間的相似度,KL-距離的計算公式為:
7.根據權利要求書1中所述的一種基于密度的加權模糊C-均值聚類方法,構造模糊C-均值聚類方法的目標函數,公式為:
8.根據權利要求書7中所述的一種基于密度的加權模糊C-均值聚類算法的目標函數,得到隸屬度函數為:
9.根據權利要求書7中所述的一種基于密度的加權模糊C-均值聚類算法的目標函數,得到聚類中心函數為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110471176.5/1.html,轉載請聲明來源鉆瓜專利網。





