[發(fā)明專利]改進(jìn)k-means的未知協(xié)議數(shù)據(jù)幀分類方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011234930.5 | 申請(qǐng)日: | 2020-11-08 |
| 公開(公告)號(hào): | CN112348084A | 公開(公告)日: | 2021-02-09 |
| 發(fā)明(設(shè)計(jì))人: | 劉治國(guó);任長(zhǎng)慶 | 申請(qǐng)(專利權(quán))人: | 大連大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 大連智高專利事務(wù)所(特殊普通合伙) 21235 | 代理人: | 李猛 |
| 地址: | 116622 遼寧省*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 改進(jìn) means 未知 協(xié)議 數(shù)據(jù) 分類 方法 | ||
本發(fā)明公開了一種改進(jìn)k?means的未知協(xié)議數(shù)據(jù)幀分類方法,屬于未知協(xié)議識(shí)別技術(shù)領(lǐng)域,包括:對(duì)獲取到的比特流數(shù)據(jù)幀的長(zhǎng)度進(jìn)行對(duì)齊處理;將數(shù)據(jù)幀中每個(gè)字節(jié)作為一個(gè)屬性,計(jì)算各屬性的信息熵來確定其權(quán)重,用于加權(quán)歐式距離;計(jì)算各個(gè)數(shù)據(jù)幀的密度,基于高密度數(shù)據(jù)集中通過最大最小距離準(zhǔn)則確定聚類中心;基于簇內(nèi)簇間加權(quán)歐式距離確定最佳聚類個(gè)數(shù)k,并輸出最佳k值下的聚類結(jié)果;可以對(duì)未知比特流形式協(xié)議的數(shù)據(jù)幀進(jìn)行快速準(zhǔn)確的聚類,效率、準(zhǔn)確率高。
技術(shù)領(lǐng)域
本發(fā)明屬于未知協(xié)議識(shí)別技術(shù)領(lǐng)域,具體說是針對(duì)未知網(wǎng)絡(luò)環(huán)境下多種未知協(xié)議數(shù)據(jù)幀分類中效率不高、準(zhǔn)確率低的問題,提出的一種改進(jìn)k-means的未知協(xié)議數(shù)據(jù)幀分類方法。
背景技術(shù)
無(wú)線通信在作戰(zhàn)環(huán)境中占據(jù)主要位置,交戰(zhàn)雙方大量的指揮、控制、情報(bào)信息通過無(wú)線通信傳遞。因此,成功截取敵方指揮信息并解析,甚至反向入侵干擾地方的指揮命令,對(duì)戰(zhàn)場(chǎng)信息對(duì)抗有著重要的意義。未知協(xié)議識(shí)別往往會(huì)以協(xié)議的分層為基礎(chǔ),對(duì)于協(xié)議未知的網(wǎng)絡(luò)數(shù)據(jù),當(dāng)前主要的研究?jī)?nèi)容為對(duì)協(xié)議的特征進(jìn)行提取,而處理的對(duì)象則為具有相同協(xié)議屬性的比特流數(shù)據(jù)幀,基于比特流數(shù)據(jù)幀的未知數(shù)據(jù)鏈路協(xié)議的識(shí)別則是一項(xiàng)重要的研究。如何將多數(shù)據(jù)鏈路層協(xié)議進(jìn)行聚類以獲得相同協(xié)議屬性的數(shù)據(jù)幀是該研究中的首要問題,因此對(duì)比特流數(shù)據(jù)幀的處理分析成為協(xié)議識(shí)別與分析的首要工作。
針對(duì)多種未知協(xié)議數(shù)據(jù)幀分類的問題,國(guó)內(nèi)外展開了很多研究,但由于比特流協(xié)議數(shù)據(jù)幀具有字段長(zhǎng)度靈活,控制開銷小,結(jié)構(gòu)緊湊等特點(diǎn),使得現(xiàn)有的研究中存在一些不足。如基于距離累加和的初始聚類中心選擇算法,采用K-means算法對(duì)預(yù)處理后的數(shù)據(jù)幀進(jìn)行聚類,提高了算法的穩(wěn)定性和效率,但該算法的局限性在于處理數(shù)據(jù)段較長(zhǎng)或存在可擴(kuò)展字段的協(xié)議數(shù)據(jù)幀時(shí)效果不佳;基于主成分分析(PCA)和密度峰聚類的無(wú)監(jiān)督聚類算法通過信息增益來確定主成分分析的維數(shù),能有效去除未知協(xié)議數(shù)據(jù)幀中的冗余信息,同時(shí)基于距離指數(shù)加權(quán)改進(jìn)密度峰聚類算法可以自動(dòng)確定聚類中心,完成對(duì)未知協(xié)議數(shù)據(jù)幀有效的分類,但該方法中的信息增益閾值難以確定;基于改進(jìn)K-means的比特流未知協(xié)議分類模型根據(jù)二進(jìn)制流的特點(diǎn)對(duì)大量的比特流協(xié)議數(shù)據(jù)幀進(jìn)行分析,以此來確定值和初始聚類中心,最后將聚類好的協(xié)議簇使用基于信息熵的混雜度評(píng)價(jià)方法進(jìn)行評(píng)價(jià),對(duì)未知協(xié)議識(shí)別進(jìn)行分類具有較高的準(zhǔn)確率,但是該方法需要分析大量的協(xié)議數(shù)據(jù)幀才能獲得近似值,時(shí)間復(fù)雜度較高;利用K-means和DBSCAN算法相結(jié)合的方式進(jìn)行未知多協(xié)議數(shù)據(jù)幀的分類方法雖然實(shí)現(xiàn)未知協(xié)議條件下數(shù)據(jù)幀的聚類得到滿意的聚類結(jié)果,但是該方法在進(jìn)行初始聚類時(shí)的聚類中心個(gè)數(shù)是指定的,在未知協(xié)議條件下,后續(xù)的聚類算法往往得不到滿意的結(jié)果。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種改進(jìn)k-means的未知協(xié)議數(shù)據(jù)幀分類方法,可以對(duì)未知比特流形式協(xié)議的數(shù)據(jù)幀進(jìn)行快速準(zhǔn)確的聚類,效率、準(zhǔn)確率高。
本發(fā)明為解決其技術(shù)問題所采用的技術(shù)方案是:一種改進(jìn)k-means的未知協(xié)議數(shù)據(jù)幀分類方法,包括:
對(duì)獲取到的比特流數(shù)據(jù)幀的長(zhǎng)度進(jìn)行對(duì)齊處理;
將數(shù)據(jù)幀中每個(gè)字節(jié)作為一個(gè)屬性,計(jì)算各屬性的信息熵來確定其權(quán)重,用于加權(quán)歐式距離;
計(jì)算各個(gè)數(shù)據(jù)幀的密度,基于高密度數(shù)據(jù)集中通過最大最小距離準(zhǔn)則確定聚類中心;
基于簇內(nèi)簇間加權(quán)歐式距離確定最佳聚類個(gè)數(shù)k,并輸出最佳k值下的聚類結(jié)果。
進(jìn)一步的,對(duì)獲取到的比特流數(shù)據(jù)幀的長(zhǎng)度進(jìn)行對(duì)齊處理,具體為:將64B作為對(duì)齊處理后數(shù)據(jù)幀的長(zhǎng)度,大于此長(zhǎng)度的數(shù)據(jù)幀部分舍去,不足此長(zhǎng)度的數(shù)據(jù)幀通過0補(bǔ)齊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連大學(xué),未經(jīng)大連大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011234930.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種實(shí)現(xiàn)K?means聚類的方法及裝置
- 一種K-means聚類的初值選擇方法
- 基于二次K-Means聚類的室內(nèi)位置指紋定位方法
- 一種基于改進(jìn)K-means聚類算法的缺失數(shù)據(jù)填充方法
- 基于K值估計(jì)的K-Means水下圖像背景分割改進(jìn)算法
- 沉積相邊界識(shí)別方法及裝置
- 一種基于密度Canopy的K-means聚類方法
- 基于并行改進(jìn)的K-means算法的大數(shù)據(jù)文本聚類方法及系統(tǒng)
- 基于K-Means和CART回歸樹的路感模擬方法
- 一種基于K-Means和BP神經(jīng)網(wǎng)絡(luò)的路感模擬方法
- 一種未知應(yīng)用層協(xié)議自動(dòng)分析方法
- 打開未知文件的方法和裝置
- 未知節(jié)點(diǎn)利用多跳節(jié)點(diǎn)縮小其可能位置區(qū)域的定位方法
- 一種利用多跳未知節(jié)點(diǎn)鄰居來提高定位精度的定位方法
- 未知文件的打開方法及裝置
- 未知號(hào)碼分級(jí)方法、未知號(hào)碼標(biāo)記方法及裝置
- 一種針對(duì)現(xiàn)有導(dǎo)航地圖中未知的道路進(jìn)行識(shí)別和導(dǎo)航的方法
- 一種未知組播報(bào)文的處理方法和裝置
- 一種農(nóng)藥殘留的檢測(cè)方法、系統(tǒng)、電子裝置及存儲(chǔ)介質(zhì)
- 未知病毒感染追溯方法、裝置及系統(tǒng)
- 圖像診斷裝置、醫(yī)用系統(tǒng)以及協(xié)議管理方法
- 一種自動(dòng)協(xié)議識(shí)別方法及系統(tǒng)
- 客戶端中遞送協(xié)議數(shù)據(jù)單元的方法及相關(guān)裝置
- 遠(yuǎn)程通訊系統(tǒng)
- 一種基于可拼裝通信協(xié)議棧的通信方法及系統(tǒng)
- 一種實(shí)現(xiàn)國(guó)產(chǎn)平臺(tái)PXEBOOT的協(xié)議架構(gòu)
- CBTC通信系統(tǒng)協(xié)議解析方法、協(xié)議庫(kù)管理方法
- 一種協(xié)議轉(zhuǎn)換的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于燈光控制的協(xié)議轉(zhuǎn)換系統(tǒng)及方法
- 一種通用工藝人工智能物聯(lián)網(wǎng)網(wǎng)關(guān)





