[發明專利]一種基于均勻抽樣的二階差分聚類數確定方法在審
| 申請號: | 201611008315.6 | 申請日: | 2016-11-16 |
| 公開(公告)號: | CN106598916A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 陳艷;易葉青;陳光 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06K9/62 |
| 代理公司: | 上海泰能知識產權代理事務所31233 | 代理人: | 宋纓,錢文斌 |
| 地址: | 201620 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 均勻 抽樣 二階差分聚類數 確定 方法 | ||
1.一種基于均勻抽樣的二階差分聚類數確定方法,其特征在于,包括以下步驟:
(1)利用均勻抽樣設計得到具有代表性的樣本子集;
(2)利用二階差分確定聚類數目,對目標函數求二階差分發現二階差分的極大值就是最佳聚類數。
2.根據權利要求1所述的基于均勻抽樣的二階差分聚類數確定方法,其特征在于,所述步驟(1)具體包括以下子步驟:
(11)設置初始門限值A>0,從大數據集合X中隨機抽取n0個點,記作令n=n0,得到點集An的中心化L2偏差CL2為CL2(An)2;
(12)在大數據集合X中讀取下一輪數據為y={y1,…,yi},將y當作xn+1,得到CL2(An+1)2;
(13)得到α=CL2(An+1)2-CL2(An)2,當α<A,則y被選中,將An+1放入大數據集合X中,否則舍棄,令n=n+1,再返回步驟(12);當大數據集合X中的點被讀取完,抽樣結束,最終n為抽樣總數。
3.根據權利要求1所述的基于均勻抽樣的二階差分聚類數確定方法,其特征在于,所述步驟(2)具體包括以下子步驟:
(21)設定目標函數為
(22)對目標函數進行一階差分后,再進行二階差分得到二階差分極大值所對應的點就是最佳聚類數;其中,λ1和λ2分別為類內和類間所占的不同權值,SW為類內散度矩陣,c為聚類數目,SB為類間散度矩陣,X為大數據集合,c為聚類數目,Z=[z1,…,zc]表示聚類中心,1<c<n,代表第i類與第k類的類間距離的權重,利用步驟(1)中得到的樣本子集來代替大數據集合X。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611008315.6/1.html,轉載請聲明來源鉆瓜專利網。





