[發(fā)明專利]聚類方法中基于信息熵的聚類數目優(yōu)化方法在審
| 申請?zhí)枺?/td> | 201910383553.2 | 申請日: | 2019-05-09 |
| 公開(公告)號: | CN110276373A | 公開(公告)日: | 2019-09-24 |
| 發(fā)明(設計)人: | 黃明勝;韋鋒;楊金華;王鑫;嚴憲平;李翠珍;馬鑫 | 申請(專利權)人: | 貴州電網有限責任公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都拓荒者知識產權代理有限公司 51254 | 代理人: | 鄒廣春 |
| 地址: | 550002 貴*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息熵 聚類 離散分布 樣本數據 優(yōu)化 概率信息 質心距離 質心 運算復雜度 運算效率 聚類法 電廠 | ||
1.一種聚類方法中基于信息熵的聚類數目優(yōu)化方法,在所述聚類方法中包括樣本數據和質心,其特征在于,所述優(yōu)化方法包括:
獲取所述樣本數據與對應的所述質心之間的質心距離;
基于所述質心距離獲得所述樣本數據的出現概率信息;
對所述信息熵進行處理以獲得處理后信息熵;
對所述處理后信息熵進行離散分布處理以獲得離散分布信息熵;
基于所述出現概率信息和所述離散分布信息熵獲得優(yōu)化后聚類數目。
2.根據權利要求1所述的優(yōu)化方法,其特征在于,所述聚類方法為k-means聚類算法,所述獲取所述樣本數據與對應的所述質心之間的質心距離,包括:
基于所述樣本數據中獲取k個聚類中心,其中所述k為正整數;
獲取每個所述樣本數據與所述聚類中心的初始距離;
基于所述初始距離對所述樣本數據進行分類以獲得所述樣本數據的多個聚類,其中每個所述聚類包括一個質心;
基于所述質心獲得所述樣本數據與對應的所述質心之間的質心距離。
3.根據權利要求2所述的優(yōu)化方法,其特征在于,所述基于所述質心距離獲得所述樣本數據的出現概率信息,包括:
基于所述質心距離獲得所述樣本數據的出現概率信息,所述出現概率信息表征為:
其中,x為樣本數據、μ為質心、a為所述樣本數據與所述質心的距離最小值、b為所述樣本數據與所述質心的距離最大值、為標準正太分布函數、Φ()為標準正太分布函數的累計分布函數。
4.根據權利要求3所述的優(yōu)化方法,其特征在于,所述優(yōu)化方法還包括:
基于所述距離最小值和所述距離最大值確定區(qū)間長度Δ;
基于所述區(qū)間長度Δ對所述出現概率信息進行優(yōu)化,以獲得優(yōu)化后出現概率信息,所述優(yōu)化后出現概率信息表征為:
5.根據權利要求4所述的優(yōu)化方法,其特征在于,所述對所述信息熵進行處理以獲得處理后信息熵,包括:
獲取所述樣本數據的信息熵,所述信息熵表征為:
其中,X為所述樣本數據所包含的可能狀態(tài)、NX為所述樣本數據的狀態(tài)數、pi為第i個樣本數據狀態(tài)發(fā)生的概率,i為正整數;
對所述信息熵進行加權處理以獲得所述樣本數據的加權熵,所述加權熵表征為:
其中Mk為第k類聚類的樣本數據的樣本數量、MA為樣本數據的總數量;
將所述加權熵作為處理后信息熵。
6.根據權利要求5所述的優(yōu)化方法,其特征在于,所述對所述處理后信息熵進行離散分布處理以獲得離散分布信息熵,包括:
獲取離散分布均勻模型,所述離散分布均勻模型表征為:
其中,為在每個所述聚類中任意一個樣本數據i與對應的所述質心的平均距離;
基于所述離散分布均勻模型對所述處理后信息熵進行離散分布處理以獲得離散分布信息熵,所述離散分布信息熵表征為:
其中,
7.根據權利要求6所述的優(yōu)化方法,其特征在于,所述基于所述出現概率信息和所述離散分布信息熵獲得優(yōu)化后聚類數目,包括:
基于所述出現概率信息和所述離散分布信息熵生成間隙信息EGap,所述間隙信息EGap表征為:
;
基于所述間隙信息EGap獲得聚類數目k;
獲取所述聚類數目k的最小值,并將所述最小值確定為優(yōu)化后聚類數目。
8.根據權利要求7所述的優(yōu)化方法,其特征在于,所述基于所述間隙信息EGap獲得聚類數目k,包括:
基于所述間隙信息EGap生成優(yōu)化公式:
基于所述優(yōu)化公式獲得聚類數目k。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州電網有限責任公司,未經貴州電網有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910383553.2/1.html,轉載請聲明來源鉆瓜專利網。





