[發明專利]基于改進型K均值聚類算法的樣本分類方法在審
| 申請號: | 202011107384.9 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112232412A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 馬胤剛;蔣輝;張冠男;張曉凡 | 申請(專利權)人: | 沈陽天眼智云信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 沈陽維特專利商標事務所(普通合伙) 21229 | 代理人: | 李丹 |
| 地址: | 110000 遼寧省沈陽市渾南區遠航*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進型 均值 算法 樣本 分類 方法 | ||
1.基于改進型K均值聚類算法的樣本分類方法,其特征在于,包括:
S1:獲取所有待分類的樣本,形成樣本數據集X;
S2:從樣本數據集X中初步選定K個質心,其中,K為聚類數量,具體包括:
S21:對樣本數據集X中的所有樣本進行均值計算,得到樣本中心;
S22:分別計算樣本數據集X中的每個樣本與樣本中心的距離,并將距離樣本中心的距離最大的樣本選定為第一個質心;
分別計算樣本數據集X中除第一個質心以外的每個樣本與選定的第一個質心的距離,并將距離第一個質心的距離最大的樣本選定為第二個質心;
第n個質心的計算方法如下,其中,2n=K:
分別計算樣本數據集X中除前n-1個質心以外的每個樣本與選定的前n-1個質心的距離,并將距離前n-1個質心的距離和最大的樣本選定為第n個質心;
S3:依次將每個樣本與距其最近的質心歸至一類,形成K個樣本簇;
S4:對每個樣本簇進行均值計算,得到每個樣本簇的質心,并以此更新已選定的K個質心,其中,每個樣本簇的質心均為樣本數據集X中的樣本;
S5:重復S3和S4,直至質心不再變化,并獲得K個樣本簇,完成樣本的分類。
2.按照權利要求1所述基于改進型K均值聚類算法的樣本分類方法,其特征在于:S4:對每個樣本簇進行均值計算,得到每個樣本簇的質心,并以此更新已選定的K個質心,其中,每個樣本簇的質心均為樣本數據集X中的樣本,具體包括:
S41:對每個樣本簇進行均值計算,得到每個樣本簇的中心;
S42:依次在每個樣本簇中,選定與該樣本簇的中心距離最近的樣本作為該樣本簇的質心;
S43:以S42中得到的K個樣本簇的質心更新已選定的K個質心。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽天眼智云信息科技有限公司,未經沈陽天眼智云信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011107384.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鋰離子方形模組和電動車輛
- 下一篇:一種中頻爐循環水壓力報警裝置





