[發(fā)明專利]一種基于SOM與K-means融合算法的網(wǎng)絡(luò)流量分類方法有效
| 申請?zhí)枺?/td> | 201911194495.5 | 申請日: | 2019-11-28 |
| 公開(公告)號: | CN111211994B | 公開(公告)日: | 2022-08-19 |
| 發(fā)明(設(shè)計)人: | 趙莎莎;肖毅;張登銀;寧越強;王飛;李速 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | H04L47/2441 | 分類號: | H04L47/2441;H04L43/0876;G06N3/08;G06K9/62 |
| 代理公司: | 南京瑞弘專利商標事務(wù)所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 som means 融合 算法 網(wǎng)絡(luò)流量 分類 方法 | ||
1.一種基于SOM與K-means融合算法的網(wǎng)絡(luò)流量分類方法,其特征在于,包括以下步驟:
步驟1,采集網(wǎng)絡(luò)流量數(shù)據(jù)集,確定訓(xùn)練集,并統(tǒng)計流量特征;
步驟2,采用基于相關(guān)性的特征選擇算法對統(tǒng)計后的流量特征進行篩選,然后從篩選后的訓(xùn)練集中計算特征-類相關(guān)矩陣和特征-特征相關(guān)矩陣,其次用最佳優(yōu)先搜索方法搜索特征子集空間,計算特征子集的估計值,找出估計值最大的特征子集,作為最優(yōu)特征子集;
步驟3,融合算法將聚類分為兩階段進行,第一階段:將最優(yōu)特征子集對應(yīng)的特征向量作為輸入樣本輸入SOM網(wǎng)絡(luò),執(zhí)行SOM算法不斷更新各個神經(jīng)元的權(quán)值,直至達到設(shè)定的迭代次數(shù),結(jié)束算法運行,輸出聚類結(jié)果,計算出聚類后的簇中心和簇的數(shù)目;第二階段:將第一階段聚類后的簇中心和簇的數(shù)目分別作為K-means算法的初始聚類中心和初始K值,執(zhí)行K-means算法直至算法收斂,輸出最終的聚類結(jié)果;
步驟311,設(shè)置初始學(xué)習(xí)率η0,競爭層的神經(jīng)元個數(shù)為m,迭代次數(shù)設(shè)為T;
輸入向量為X(n)=(x1(n),x2(n),…,xn(n))
權(quán)值向量為Wi(t)=(wi1(t),wi2(t),…,win(t)),i=1,2,…,m
步驟312,取區(qū)間[0,1]內(nèi)的隨機值對競爭層各個神經(jīng)元的權(quán)值向量Wi進行初始化,并對當前輸入向量X和初始權(quán)值向量Wi(0)全部進行歸一化處理:
其中,表示歸一化的當前輸入向量,表示歸一化的第i個神經(jīng)元初始權(quán)值向量;
步驟313,將與競爭層所有神經(jīng)元對應(yīng)的權(quán)值向量進行相似性對比,即將兩者做點積,選出點積值最大的作為獲勝神經(jīng)元i*;
步驟314,定義優(yōu)勝鄰域初始優(yōu)勝鄰域N(t0)較大,訓(xùn)練過程中會隨著迭代次數(shù)的增加而不斷收縮,對優(yōu)勝鄰域內(nèi)的所有神經(jīng)元調(diào)整權(quán)值向量,權(quán)值更新過程如下所示:
式中,Wi(t)為第i個神經(jīng)元在t時刻的權(quán)值,η(t)表示t時刻的學(xué)習(xí)率,學(xué)習(xí)率會隨著迭代次數(shù)增加而衰減,d表示拓撲距離,e-d表明離獲勝神經(jīng)元越遠,權(quán)值更新比例越小;
步驟315,更新學(xué)習(xí)率η(t)和優(yōu)勝鄰域N(t),如下所示,并將更新后的權(quán)值向量重新歸一化處理;
步驟316,當學(xué)習(xí)率ηηmin或達到指定迭代次數(shù)時,結(jié)束訓(xùn)練;否則轉(zhuǎn)至步驟312不斷重復(fù)此流程,直至滿足結(jié)束判定條件;
步驟321,選取階段一訓(xùn)練后的聚類中心作為初始聚類中心,選取簇數(shù)作為初始K值;
步驟322,使用階段一歸一化處理后的數(shù)據(jù)集作為輸入樣本;
步驟323,遍歷所有數(shù)據(jù),計算數(shù)據(jù)點到聚類中心的距離,并將其劃分到最近的中心點中,形成K個簇;
步驟324,使用誤差平方和SSE作為聚類的目標函數(shù):
其中,k表示簇類數(shù)目,cj表示第j個聚類中心,dist表示的是歐幾里得距離,簇的最小化SSE的簇中心即簇中所有點的均值,因此,計算每個簇的平均值,將其作為新的簇中心;
步驟325,重復(fù)步驟323、步驟324,直至簇中心不再發(fā)生改變,則視為算法已經(jīng)收斂,輸出聚類結(jié)果;
步驟4,使用S_Dbw指數(shù)評估算法的聚類效果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911194495.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





