[發明專利]密度不均勻數據聚類方法、裝置、電子設備及存儲介質在審
| 申請號: | 202210801364.4 | 申請日: | 2022-07-08 |
| 公開(公告)號: | CN115130602A | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 唐亮;張繼東;呂超;吳風蛟 | 申請(專利權)人: | 天翼數字生活科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 黃忠 |
| 地址: | 200000 上海市靜安*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 密度 不均勻 數據 方法 裝置 電子設備 存儲 介質 | ||
1.一種密度不均勻數據聚類方法,其特征在于,包括:
獲取包含多個數據對象的數據集;
計算所述數據集中兩兩數據對象之間的距離,并采用所有所述距離建立KNN矩陣;
將所述數據集劃分為多個密度集合,并根據所述密度集合計算所述KNN矩陣中每一列的聚類效果指數;
將數值最大的聚類效果指數對應的列序號確定為最小聚類點數;
計算每個所述密度集合的鄰域半徑;
采用所述最小聚類點數和所述鄰域半徑對相應的密度集合進行局部聚類,得到聚類結果;
輸出所有所述聚類結果。
2.根據權利要求1所述的方法,其特征在于,所述計算所述數據集中兩兩數據對象之間的距離,并采用所有所述距離建立KNN矩陣的步驟,包括:
計算所述數據集中兩兩數據對象之間的距離;
采用所有所述距離生成距離矩陣;
對所述距離矩陣中的每一列進行升序排列,得到調整距離矩陣;
將所述調整距離矩陣進行轉置,生成KNN矩陣。
3.根據權利要求1所述的方法,其特征在于,所述將所述數據集劃分為多個密度集合,并根據所述密度集合計算所述KNN矩陣中每一列的聚類效果指數的步驟,包括:
計算所述KNN矩陣中每一列的密度變化序列;
計算每個所述密度變化序列的跳變閾值;
根據所述跳變閾值將所述數據集劃分為多個密度集合;
根據所述密度集合計算所述KNN矩陣中每一列的聚類效果指數。
4.根據權利要求3所述的方法,其特征在于,所述根據所述跳變閾值將所述數據集劃分為多個密度集合的步驟,包括:
將跳變閾值處于同一區間范圍的密度變化序列劃分到同一個密度集合,得到多個密度集合。
5.根據權利要求3所述的方法,其特征在于,所述根據所述密度集合計算所述KNN矩陣中每一列的聚類效果指數的步驟,包括:
根據所述密度集合確定所述KNN矩陣中每一列的斷點;
分別計算所述KNN矩陣中每一列的所有斷點的斷點曲線增長距離;
根據所述KNN矩陣中每一列的所有斷點的曲線增長距離,分別計算所述KNN矩陣中每一列的總斷點曲線增長距離;
計算所述KNN矩陣中每一列的總曲線增長距離;
根據所述總斷點曲線增長距離和所述總曲線增長距離,計算所述KNN矩陣中每一列的聚類效果指數。
6.根據權利要求1所述的方法,其特征在于,所述計算每個所述密度集合的鄰域半徑的步驟,包括:
分別計算每個所述密度集合中所有數據對象間的距離的平均值;
分別獲取每個所述密度集合的所有數據對象間的距離的最大值和中位數;
采用所述平均值、所述最大值和所述中位數,計算對應的密度集合的鄰域半徑。
7.一種密度不均勻數據聚類裝置,其特征在于,包括:
數據集獲取模塊,用于獲取包含多個數據對象的數據集;
KNN矩陣建立模塊,用于計算所述數據集中兩兩數據對象之間的距離,并采用所有所述距離建立KNN矩陣;
聚類效果指數計算模塊,用于將所述數據集劃分為多個密度集合,并根據所述密度集合計算所述KNN矩陣中每一列的聚類效果指數;
最小聚類點數確定模塊,用于將數值最大的聚類效果指數對應的列序號確定為最小聚類點數;
鄰域半徑計算模塊,用于計算每個所述密度集合的鄰域半徑;
局部聚類模塊,用于采用所述最小聚類點數和所述鄰域半徑對相應的密度集合進行局部聚類,得到聚類結果;
聚類結果輸出模塊,用于輸出所有所述聚類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天翼數字生活科技有限公司,未經天翼數字生活科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210801364.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





