[發明專利]一種面向行為識別的密度適應性聚類方法在審
申請號: | 201510990402.5 | 申請日: | 2015-12-28 |
公開(公告)號: | CN105654115A | 公開(公告)日: | 2016-06-08 |
發明(設計)人: | 倪紅波;王天本;周興社;張大慶;王柱;賈江波 | 申請(專利權)人: | 西北工業大學 |
主分類號: | G06K9/62 | 分類號: | G06K9/62 |
代理公司: | 暫無信息 | 代理人: | 暫無信息 |
地址: | 710068 *** | 國省代碼: | 陜西;61 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 面向 行為 識別 密度 適應性 方法 | ||
技術領域
本發明涉及數據識別技術領域,尤其涉及一種面向行為識別的密度適應 性聚類方法。
背景技術
基于密度的聚類方法是基于聚類方法的一個重要分支,其主要通過度量 區域中所包含的點的數量來進行聚類。經典的基于密度的聚類方法主要有 DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)和 OPSTICS(OrderingPointstoIdentifytheClusteringStructure)。傳統的基于密 度的算法的主要優點有以下三個方面。1.對噪音數據不敏感,可自動排除噪 音數據對聚類過程的影響。2.能發現任意形狀的簇。由于其聚類過程為典型 的迭代擴展過程,因此可以克服基于距離算法只能發現類圓形的聚類簇的缺 點。3.能發現任意數量的聚類簇,事先不需要知道聚類簇的個數。較為優良 的聚類性能使其在科學研究及工程實踐中均具有重要的應用意義。
傳統的基于密度的聚類算法使用全局唯一的密度參數(ε,MinPts),因 此當數據分布不均勻,即聚類簇間密度差異較大便可能出現一下兩種狀況:1. 當密度參數設置的過低時可能會導致離的較近的多個簇被合并成一個簇。2. 當密度參數設置的過高時,密度較低的簇則會被視為噪音數據。其上述不足 限制了其應用范圍。
發明內容
針對上述缺陷或不足,本發明提供一種面向行為識別的密度適應性聚類 方法,能夠通過輸入最的最高密度閾值、最低密度閾值和密度層次數產生多 個密度閾值,并在多個密度閾值上使用修正過的DBSCAN算法對數據進行 多次聚類。
為達到以上目的,本發明的技術方案為:
包括以下步驟:
1)設定密度層次及最高、最低密度閾值,并根據所設定的密度層次及最 高、最低密度閾值計算各個層次上的密度閾值;
2)將密度閾值從高到低進行排列,選取密度閾值中最高密度閾值對數據 進行第一次聚類,產生聚類族;
3)將剩余密度閾值重新從高到底進行排列,選取密度閾值中最高密度閾 值對數據進行第i次聚類,產生聚類族;其中,第i次聚類過程產生的聚類 簇,在后續聚類過程中只能被擴展而不能被分割或者合并到其他簇;滿足當 前密度閾值的新簇應該被優先提取以避免與被已存在的簇合并;
4)重復步驟3),直到根據所有的密度閾值將數據聚類完成,將所聚類 的數據進行行為識別。
所述步驟1)具體為:
設定密度層次DensityLevel、最低密度閾值(Epsl,MinPtsl),最高密度 閾值(Epsh,MinPtsh),根據所設定的密度層次DensityLevel,設定聚類的多 個密度閾值(Epsi,MinPtsi),i=1,2,......,其中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510990402.5/2.html,轉載請聲明來源鉆瓜專利網。