[發明專利]一種解決大數據聚類的基于視覺原理的聚類方法有效
| 申請號: | 201710861282.8 | 申請日: | 2017-09-21 |
| 公開(公告)號: | CN108108747B | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 徐宗本;張儷文;楊樹森 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/28;G06F16/35 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 徐文權 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 解決 數據 基于 視覺 原理 方法 | ||
1.一種解決大數據聚類的基于視覺原理的聚類方法,其特征在于,包括以下步驟:
步驟一,確定編碼精度:根據不同應用場景,設定不同的編碼精度ε,ε的大小顯示了編碼與原始數據之間的誤差;
步驟二,確定編碼位數與最小尺度,最大尺度:由編碼精度ε計算出編碼的最大尺度σmax與最小尺度σ0,同時可以得到編碼的位數L;
步驟三,原數據編碼:將原數據集以編碼精度ε進行編碼,除返回聚類結果外,之后的計算步驟將都在編碼上進行;
步驟四,截斷操作會根據當前的尺度,對編碼集中的各個編碼進行截斷,獲取該尺度下的編碼集;
在當前尺度的編碼集的基礎上,進行各個編碼的同尺度相鄰編碼查找,組成與相鄰編碼相連的圖數據;
之后利用上一步圖數據進行連通性分析,得到的最大連通子圖為聚類結果,具體方法如下:
圖對Gσ進行最大連通子圖分析,得到kσ個最大連通子圖,即各子圖的頂點集合聚類結果為
其中,εσ為編碼連接關系集合,Gi為第i個連通子圖,Ci為Gi中的包括的編碼;
再將聚類結果解碼,從編碼回歸到原數據;
步驟五,增加尺度數,σ=σ+1,重復步驟四操作,直到最大尺度σmax。
2.根據權利要求1所述的一種解決大數據聚類的基于視覺原理的聚類方法,其特征在于,所述步驟二中,d維的原始數據集中的任意元素對于x的每一維x(t)∈[at,bt],t∈[1,d],最大尺度σmax滿足
最小尺度σ0通常為1,編碼的位數L=σmax×d,為d維實數空間,x為原始數據集中的任意元素,gt為第t維的編碼精度。
3.根據權利要求1所述的一種解決大數據聚類的基于視覺原理的聚類方法,其特征在于,所述步驟三中,對原始數據中的每個元素進行S/D編碼,獲得原始編碼集Pε(·)為S/D編碼函數,
e=Pε(x),e=[e(1)e(2)…e(L)]
其中,[·]2表示數字的二進制形式,表示向下取整操作,x為原始數據集中的任意元素,為原始數據集,[e(1)e(2)…e(L)]分別表示編碼后的二進制序列,at為第t維在原始數據集的下界,x(t)為x的第t維的數據,gt為第t維的編碼精度。
4.根據權利要求1所述的一種解決大數據聚類的基于視覺原理的聚類方法,其特征在于,所述在當前尺度的編碼集的基礎上,進行各個編碼的同尺度相鄰編碼查找,組成與相鄰編碼相連的圖數據,構造提取同一維度數值的模板編碼
編碼e近鄰編碼集合為,
其中,∧表示邏輯與操作,表示邏輯非操作,建立所有編碼與其相鄰編碼的連接關系,得到σ尺度下的連接關系集合εσ。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710861282.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





