[發明專利]一種基于樽海鞘群算法優化的模糊C均值聚類方法在審
| 申請號: | 202011294923.4 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112381157A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 嚴忠貞;江元璋;周可薇;張軍;張俊杰;嚴賽男;朱信遠;陳豪 | 申請(專利權)人: | 湖北工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/00 |
| 代理公司: | 棗莊小度智慧知識產權代理事務所(普通合伙) 37282 | 代理人: | 周莉 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 海鞘 算法 優化 模糊 均值 方法 | ||
本發明公開一種基于樽海鞘群算法優化的模糊C均值聚類方法,該方法包括:初始化該優化算法參數,預處理待聚類的數據集;構建目標函數,即對可行解的評價函數;對目標函數進行最優值求解,得到最優值并確定對應的最優初始聚類中心;根據最優初始聚類中心進行模糊C均值聚類,最終得到聚類結果。采用本發明方法或系統對模糊C均值聚類進行基于樽海鞘群算法的初始聚類中心優化,解決了模糊聚類效果極易受隨機初始聚類中心的影響。
技術領域
本發明涉及聚類方法領域,特別是涉及一種基于樽海鞘群算法優化的模糊C均值聚類方法。
背景技術
模糊C均值(FCM)是一種基于無監督學習機制的常用聚類方法,該聚類函數利用聚類中心(距離)計算函數和FCM目標函數。FCM的主要步驟是迭代過程,它更新隸屬函數值和中心位置及其值。在FCM中,高隸屬度值表示更靠近該類中心,低隸屬度值表示距該類中心較遠。FCM對初始聚類中心極其敏感,聚類數目、數據集特征和模糊指數m等因素都對聚類效果影響很大,不同的初始聚類中心即可能導致不同的聚類結構,該聚類算法易受初始聚類中心影響而陷入局部最優,初始聚類中心的選取是問題所在。
解決聚類算法中初始聚類中心選取的問題的方法主要有傳統的數學邏輯方法和智能計算算法兩大類,傳統的方法由于自身邏輯復雜或者難以保證有效形成更優的初始聚類中心,導致其在面對聚類算法初始類中心選取這類非線性優化問題時求解難度較高。傳統的粒子群算法在面對高維度、大規模、多約束的初始聚類中心選取問題容易陷入局部最優解而不能保證全局收斂。
發明內容
本發明的目的是提供一種基于樽海鞘群算法優化的模糊C均值聚類方法,對模糊C均值聚類進行基于樽海鞘群算法的初始聚類中心優化,解決了模糊聚類結果極易受初始聚類中心的選取的影響而陷入局部最優的問題。
為實現上述目的,本發明提供了如下方案:
一種基于樽海鞘群算法優化的模糊C均值聚類方法,包括:
根據該優化算法的特征初始化所需參數,預處理待聚類的若干數據集;
根據數據集描述設置待聚類數據集的聚類數目;
根據樽海鞘群優化算法對初始聚類中心的編碼,并使用對其評價作為目標函數;
根據樽海鞘群算法結合所述模糊聚類初始聚類中心對所述目標函數進行最優值求解,得到最優值;
根據所述最優值確定對應的最優初始聚類中心;
根據所述最優初始聚類中心作為模糊C均值聚類的初始化聚類中心,并繼續進行后續步驟;
根據所述初始聚類中心確定方法解決了模糊聚類極易受初始點影響的問題。
可選的,所述目標函數具體為:其中ui,j是xj屬于類別ci的隸屬度,ci是類i的聚類中心,|| ||norm表示歸一化數據的歐氏距離。
可選的,所述根據所述樽海鞘群優化算法結合的初始聚類中心編碼的方式具體為:根據待聚類數據集的已知聚類數目C和待聚類數據集的屬性數目,也即是數據維度dim確定所述聚類中心在優化算法中編碼應為C×dim維的向量,編碼方式具體可表示為C=c1,1,c1,2,...c1,d,c2,1,c2,2...ci,j...cc,dim,其中ci,j,i∈(1,2,...C),j∈(1,2,...dim)代表第i類中心的第j維的數據值。
可選的,所述根據樽海鞘群算法結合所述模糊聚類初始聚類中心對所述目標函數進行最優值求解,得到最優值具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業大學,未經湖北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011294923.4/2.html,轉載請聲明來源鉆瓜專利網。





