[發(fā)明專利]一種基于樣本密度的全局優(yōu)化K均值聚類方法及系統(tǒng)在審

申請(qǐng)?zhí)枺?/td>	201810525709.1	申請(qǐng)日：	2018-05-28
公開（公告）號(hào)：	CN108985318A	公開（公告）日：	2018-12-11
發(fā)明（設(shè)計(jì)）人：	許鴻文;薛印璽;陳雯;李羚;殷蔚明;謝靖	申請(qǐng)（專利權(quán)）人：	中國地質(zhì)大學(xué)（武漢）
主分類號(hào)：	G06K9/62	分類號(hào)：	G06K9/62
代理公司：	武漢知產(chǎn)時(shí)代知識(shí)產(chǎn)權(quán)代理有限公司 42238	代理人：	郝明琴
地址：	430000 湖***	國省代碼：	湖北;42
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	聚類中心全局優(yōu)化樣本初始聚類中心初始中心點(diǎn) 迭代過程高斯模型聚類結(jié)果偏移操作傳統(tǒng)的數(shù)據(jù)集準(zhǔn)確率聚類全局優(yōu)化改進(jìn) 探索發(fā)現(xiàn)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于樣本密度的全局優(yōu)化K均值聚類方法，其特征在于，包含以下步驟：

S1、獲取包含N個(gè)樣本點(diǎn)的原始數(shù)據(jù)集X、子簇個(gè)數(shù)K及比例參數(shù)Ra，其中N大于1；

S2、在所述原始數(shù)據(jù)集X中隨機(jī)選取K個(gè)樣本點(diǎn)作為初始聚類中心，記為w_i,其中i＝1,2,3,…,K；

S3、分別計(jì)算原始數(shù)據(jù)集中初始聚類中心以外的所有樣本點(diǎn)距離每一個(gè)初始聚類中心w_i的距離，并將所述原始數(shù)據(jù)集中初始聚類中心以外的所有樣本點(diǎn)分配到距離其最近的初始聚類中心形成K個(gè)子簇；

S4、分別將所有子簇的質(zhì)心記為W_i，根據(jù)公式計(jì)算W_i的預(yù)估計(jì)密度值F_i,t，并計(jì)算W_i實(shí)際密度值F_i,c；

其中m為所述迭代次數(shù)的最大迭代次數(shù)且為預(yù)設(shè)值，t表示當(dāng)前的迭代次數(shù)，2(3φσ×Ra)的值根據(jù)標(biāo)準(zhǔn)正態(tài)分布函數(shù)查表得出；

S5、將每個(gè)子簇的質(zhì)心W_i作為新的聚類中心，分別判斷每個(gè)新的聚類中心所在的子簇中是否存在實(shí)際密度值F_i,c小于預(yù)估計(jì)密度值F_i,t的樣本點(diǎn)，如果不存在，跳轉(zhuǎn)到S10；如果存在，跳轉(zhuǎn)到S6；

S6、獲取實(shí)際密度值F_i,c與預(yù)估計(jì)密度值F_i,t的差值絕對(duì)值最大的樣本點(diǎn)所在的子簇；

S7、在S6得到的子簇中，隨機(jī)獲取若干個(gè)樣本點(diǎn)，并分別計(jì)算所述若干個(gè)樣本點(diǎn)的實(shí)際密度值F_i,c；

S8、判斷所述若干個(gè)個(gè)樣本點(diǎn)中是否存在實(shí)際密度值F_i,c大于預(yù)估計(jì)密度值F_i,t的樣本點(diǎn)；如果存在，則跳轉(zhuǎn)到S10；否則跳轉(zhuǎn)到S9；

S9、將實(shí)際密度值F_i,c與預(yù)估計(jì)密度值F_i,t差值絕對(duì)值最大的樣本點(diǎn)作為新的聚類中心，然后執(zhí)行步驟S10；

S10、判斷聚類中心W_i是否不再改變，若滿足則跳轉(zhuǎn)到S11；否則迭代次數(shù)t更新為t+1，將新的聚類中心作為新的初始聚類中心，跳轉(zhuǎn)到S3；

S11、輸出聚類結(jié)果。

2.根據(jù)權(quán)利要求1所述一種基于樣本密度的全局優(yōu)化K均值聚類方法，其特征在于，所述實(shí)際密度值F_i,c根據(jù)公式來計(jì)算，其中d_ij為W_i到第i個(gè)子簇中第j個(gè)樣本點(diǎn)n_ij的歐氏距離，S_i表示第i個(gè)子簇中樣本點(diǎn)的個(gè)數(shù)，j為第j個(gè)樣本點(diǎn)，c∈[1,c_max]，c_max為預(yù)設(shè)的最大偏移次數(shù)，r＝R×Ra；R為任一子簇中聚類中心離所在子簇中樣本點(diǎn)的最遠(yuǎn)距離。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國地質(zhì)大學(xué)（武漢），未經(jīng)中國地質(zhì)大學(xué)（武漢）許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810525709.1/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種基于可分離卷積和注意力機(jī)制的圖像分類方法
下一篇：影像對(duì)應(yīng)判斷方法及裝置

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06K 數(shù)據(jù)識(shí)別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形，例如，指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個(gè)筆畫組成的，而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】