[發明專利]一種聚類方法及電子設備在審
| 申請號: | 201811149734.0 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN109165696A | 公開(公告)日: | 2019-01-08 |
| 發明(設計)人: | 于連宇;高鋒 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 黃威;喻嶸 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本相似度 聚類 數據樣本 電子設備 聚類處理 獲取數據 相似度 樣本集 疏密 收斂 輸出 申請 | ||
1.一種聚類方法,其特征在于,包括:
獲取數據樣本集;
計算所述數據樣本集的樣本相似度,樣本相似度指示任意兩個數據樣本之間的相似度;
基于設定的第一閾值以及所述數據樣本集的樣本相似度進行聚類處理,使得每個聚類的樣本相似度的梯度不大于所述第一閾值,所述樣本相似度的梯度指示多個數據樣本之間的疏密程度;
輸出所述聚類處理的結果。
2.根據權利要求1所述的聚類方法,其特征在于,在所述聚類處理之前,所述方法還包括:
基于設定的第二閾值與所述數據樣本集的樣本相似度對所述數據樣本集進行聚類預處理,使得所述聚類預處理后的每個類的樣本相似度不小于所述第二閾值;
所述聚類處理包括:
對所述聚類預處理后的每個類進行聚類處理。
3.根據權利要求2所述的聚類方法,其特征在于,
所述對所述聚類預處理后的每個類進行聚類處理,包括:
針對所述每個類,指定用于形成目標聚類的至少一個初始數據樣本;
通過針對所述每個類中的其余數據樣本進行迭代計算,判定每個所述其余數據樣本是否屬于所述目標聚類,對于每次迭代,如果包括當前目標數據樣本的樣本相似度均值與不包括所述當前目標數據樣本的樣本相似度均值的差不大于所述第一閾值,則將所述當前目標數據樣本包括在所述目標聚類中;
其中,所述目標聚類中包括當前目標數據樣本的樣本相似度均值與不包括所述當前目標數據樣本的樣本相似度均值的差形成所述樣本相似度的梯度。
4.根據權利要求3所述的聚類方法,其特征在于,
所述當前樣本相似度均值為所述當前目標數據樣本與當前所述目標聚類中的各數據樣本的樣本相似度的均值,所述先前樣本相似度均值為前一個目標數據樣本與其當時對應的所述目標聚類中的各數據樣本的樣本相似度的均值。
5.根據權利要求3所述的聚類方法,其特征在于,所述當前樣本相似度均值為所述當前目標數據樣本與當前所述目標聚類中的各數據樣本的樣本相似度的均值,所述先前樣本相似度均值為當前所述目標聚類中所有任意兩個數據樣本間的樣本相似度的均值。
6.根據權利要求1所述的聚類方法,其特征在于,所述方法還包括:
對所述數據樣本集進行分組形成多組數據樣本;
所述計算所述數據樣本集的樣本相似度,包括:
根據所述多組所述數據樣本并行計算所述數據樣本集的樣本相似度。
7.一種電子設備,其特征在于,包括:
獲取模塊,用于獲取數據樣本集;
計算模塊,用于計算所述數據樣本集的樣本相似度,樣本相似度指示任意兩個數據樣本之間的相似度;
聚類處理模塊,用于基于設定的第一閾值以及所述數據樣本集的樣本相似度進行聚類處理,使得每個聚類的樣本相似度的梯度不大于所述第一閾值,所述樣本相似度的梯度指示多個數據樣本之間的疏密程度;
輸出模塊,用于輸出所述聚類處理的結果。
8.根據權利要求7所述的電子設備,其特征在于,還包括:聚類預處理模塊,用于基于設定的第二閾值與所述數據樣本集的樣本相似度對所述數據樣本集進行聚類預處理,使得所述聚類預處理后的每個類的樣本相似度不小于所述第二閾值;
所述聚類處理模塊具體用于對所述聚類預處理后的每個類進行聚類處理。
9.根據權利要求8所述的電子設備,其特征在于,所述聚類處理模塊具體用于:針對所述每個類,指定用于形成目標聚類的至少一個初始數據樣本;
通過針對所述每個類中的其余數據樣本進行迭代計算,判定每個所述其余數據樣本是否屬于所述目標聚類,對于每次迭代,如果包括當前目標數據樣本的樣本相似度均值與不包括所述當前目標數據樣本的樣本相似度均值的差不大于所述第一閾值,則將所述當前目標數據樣本包括在所述目標聚類中;
其中,所述目標聚類中包括當前目標數據樣本的樣本相似度均值與不包括所述當前目標數據樣本的樣本相似度均值的差形成所述樣本相似度的梯度。
10.根據權利要求7所述的電子設備,其特征在于,還包括:
分組模塊,用于對所述數據樣本集進行分組形成多組數據樣本;
所述計算模塊具體用于根據多組所述數據樣本并行計算所述數據樣本集的樣本相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811149734.0/1.html,轉載請聲明來源鉆瓜專利網。





