[發明專利]基于最小距離最大化準則優化初始中心的模糊聚類方法在審
| 申請號: | 201810889964.4 | 申請日: | 2018-08-07 |
| 公開(公告)號: | CN109272015A | 公開(公告)日: | 2019-01-25 |
| 發明(設計)人: | 陳鑫;左光;齊玢;石泳;侯硯澤;張敏捷;陳沖 | 申請(專利權)人: | 北京空間技術研制試驗中心 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京謹誠君睿知識產權代理事務所(特殊普通合伙) 11538 | 代理人: | 陸鑫;延慧 |
| 地址: | 100094 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 最大化準則 模糊聚類 最小距離 樣本點 優化 空間分布特性 歐式距離 初始點 魯棒性 求解 稠密 集合 重復 | ||
本發明涉及一種基于最小距離最大化準則優化初始中心的模糊聚類方法,包括以下步驟:a.求解樣本點中任意兩點之間的歐式距離;b.計算每個點到其他點的距離的平均值;c.確定第一個聚類初始中心;d.確定稠密樣本點集合;e.確定下一個聚類初始點;f.重復步驟e,直至選取所有所需的初始聚類點個數。根據本發明的基于最小距離最大化準則優化初始中心的模糊聚類方法相比于標準FCM方法能夠考慮對象的空間分布特性,且具有更好的聚類效果和魯棒性,具有更高的效率。
技術領域
本發明涉及一種基于最小距離最大化準則優化初始中心的模糊聚類方法。
背景技術
聚類分析的基本思想是根據各個待分類樣本點之間的相似程度,將相似特性樣本點歸為一類的方法。近年來,模糊聚類技術作為一種重要的數據處理技術手段,受到越來越多的關注和重視。模糊c均值(fuzzy C-means,FCM)方法是目標函數聚類方法中點的典型代表,它利用模糊理論建立對象類屬的不確定性描述,通過優化目標函數得到每個對象對類中心的隸屬度,從而起決定樣本點的類屬。標準FCM方法實現容易、聚類效果較好,特別是在大數據處理、人工智能應用、顧客期望服務調度系統、新聞熱點分析、圖像分割等領域得到廣泛應用。但是標準FCM方法存在以下問題:1)初始聚類中心是隨機選取,因此對聚類結果影響較大,存在著魯棒性差的問題;2)忽略了各個樣本點空間位置分布的不同對聚類結果的影響。
模糊c-均值聚類方法(Fuzzy c-means Clustering Method,FCM)是由Bezkek于1981年提出的,它是目前廣泛采用的一種模糊聚類算法。在縮減設計空間時,模糊c-均值聚類法用于對數據點的隸屬度進行分類,完成數據的模糊聚類劃分。
FCM方法如下:考慮一個樣本集合X=[xij],i=1,2,L,m;j=1,2,L,n,其中m代表所含的樣本點個數,n代表樣本點的維數。將此集合依據一定的準則用模糊聚類的方法分成個模糊子集,這里c是給定的聚類個數,所用的準則一般是優化一個用來表征聚類的性能指標的目標函數。模糊c(2≤c≤m)聚類的分類結果可用隸屬矩陣U表示:
U=[uij],i=1,2,L,c;j=1,2,L,m (1)
式中uij的值在[0,1]之間,表示樣本集合中的元素xj屬于第i個聚類的程度,同時uij還必須滿足:
FCM算法的目標函數一般為如下形式:
式中,
式中d為影響隸屬度矩陣模糊化程度的指數權重(一般取d=2)。
求解式(3)中的極小值問題。即
給定一組樣本點,采用模糊c-均值聚類法,得到最優解,即為分組后的聚類中心坐標和樣本點隸屬于各聚類中心的隸屬度矩陣U*。
由以上FCM方法過程中可知FCM對初始中心并未定義,實際應用中通常隨機給定一組初始中心vi,不斷通過優化迭代求解(3)式的極小值問題,即式(5)所示。這樣不可避免存在聚類效率低、陷入局部優化解、由于初始點隨機選取會造成的魯棒性較差的問題。
發明內容
本發明的目的在于解決上述問題,提供一種基于最小距離最大化準則優化初始中心的模糊聚類方法。
為實現上述發明目的,本發明提供一種基于最小距離最大化準則優化初始中心的模糊聚類方法,包括以下步驟:
a.求解樣本點中任意兩點之間的歐式距離;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京空間技術研制試驗中心,未經北京空間技術研制試驗中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810889964.4/2.html,轉載請聲明來源鉆瓜專利網。





