[發明專利]一種使用模糊近鄰的魯棒性密度峰值算法及系統在審
| 申請號: | 201710137544.6 | 申請日: | 2017-03-09 |
| 公開(公告)號: | CN107038454A | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | 丁世飛;杜明晶 | 申請(專利權)人: | 中國礦業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 221116 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 模糊 近鄰 魯棒性 密度 峰值 算法 系統 | ||
技術領域
本發明涉及模式識別和機器學習領域,具體涉及一種使用模糊近鄰的魯棒性密度峰值算法及系統。
背景技術
聚類分析的密度是通過找出以“簇”的形式存在于數據集內部的結構,用以發現數據集的內部組織。這一詞指的是由近似數據點組成的被分離開來的群。直覺上講,簇的分割具有簇內相似及簇間相異的特點。因此,數據數據被分解成許多群,這些群有相似的對象構成,同時不同的群包含了各不相同的元素。該方法論被廣泛的應用于多元統計學和機器學習。
傳統的聚類大致被分為4類:劃分聚類、層次聚類、密度聚類和模型聚類。每類方式都各有利弊,如,劃分聚類通常需要指定簇個數,且需要迭代;層次聚類同樣很難找到最優的聚類個數;而傳統的密度聚類算法參數調節困難;模型聚類通常需要對數據的分布情況進行假設。2014年,《Science》上發表了一篇全新的聚類方法,密度峰值聚類(Density Peaks Clustering,DPC)。密度峰值聚類具有如下特點:無需指定簇個數;適用于任意形狀的數據集;無需迭代,也不會陷入局部最優;只有一個參數,易于調節控制;無需對數據集的分布進行假設。算法簡單,易于實現。由于以上特點,密度聚類算法也受到了越來越多的關注,并被應用于異常點檢測、圖像處理、文本處理等領域。密度峰值聚類算法給聚類問題的求解提供了新思路,能有效處理許多實際問題,其研究具有巨大的科研價值和應用潛力。
但是密度峰值聚類依然存在一些問題。例如,在同一鄰域半徑內,不同的近鄰點分布應該產生不同的近鄰隸屬度,然而原始算法沒有對此加以區分,難于處理不確定數據。
發明內容
為了解決上述問題,本發明提出一種使用模糊近鄰的魯棒性密度峰值算法及系統。首先,使用模糊近鄰函數求解出每個樣本點的近鄰隸屬度,然后,使用改進過的局部密度計算公式,求解局部密度。再利用原始算法中的求解步驟找出聚類中心點,完成聚類。該方式充分考慮了模糊關系對算法的影響,具有較強的魯棒性和泛化能力。
本發明是通過以下方案實現的:
本發明涉及一種使用模糊近鄰的魯棒性密度峰值算法及系統,通過模糊最近鄰方法,改進原始局部密度的求解方式,使整個聚類算法充分考慮數據的不確定因素。最后在求解出簇中心點,輸出聚類結果。
本發明具體步驟如下:
步驟1,依據歐式距離公式計算相似度矩陣。
步驟2,使用模糊近鄰方式重新定義近鄰隸屬度關系。
步驟3,根據相似度矩陣計算各個點的兩個重要數值:ρi和δi。
步驟3.1:依據模糊近鄰隸屬度計算出該點的局部密度ρi,其計算公式如下:
步驟3.2:由如下公式計算每個點的δi值:
步驟4,繪制出決定圖,選出其中ρi相對較高且δi非常高的點作為簇中心點。
步驟5,將每個數據點分配給離其最近的中心點所在的簇。
通過以上內容可知,本申請提供的是一種使用模糊近鄰的魯棒性密度峰值算法及系統,首先計算相似度矩陣,求解出模糊近鄰方式,然后計算出局部密度計算方式求解ρi和δi。繪制出決定圖選擇聚類中心點,分配剩余數據點,得到聚類結果。本申請充分考慮了模糊近鄰關系,并能夠很好地處理不確定性的數據,具有較強的魯棒性和泛化能力。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本申請實施例提供的一種使用模糊近鄰的魯棒性密度峰值算法的流程圖。
具體實施方式
下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述。顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有付出創造性勞動前提下所獲得的所有其它實施例,都屬于本申請保護的范圍。
實施例1
如圖1所示,本實施例包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國礦業大學,未經中國礦業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710137544.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:序批式除磷裝置
- 下一篇:一種高壓地下水修復原位注藥裝置





