[發(fā)明專利]一種識別SSR流量的方法、系統(tǒng)以及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110456660.0 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113381973B | 公開(公告)日: | 2023-02-28 |
| 發(fā)明(設(shè)計)人: | 劉杰;游帥;張風(fēng)華;李新發(fā);劉永強;景曉軍 | 申請(專利權(quán))人: | 深圳市任子行科技開發(fā)有限公司 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;G06F18/214;G06F18/24 |
| 代理公司: | 深圳市順天達專利商標(biāo)代理有限公司 44217 | 代理人: | 張蓉;郭偉剛 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 ssr 流量 方法 系統(tǒng) 以及 計算機 可讀 存儲 介質(zhì) | ||
本發(fā)明公開了一種識別SSR流量的方法、系統(tǒng)以及計算機可讀存儲介質(zhì),方法包括:搭建所有配置的SSR服務(wù),通過抓包工具抓取不同配置的SSR流量,以及采集普通流量;計算抓取到的不同配置的SSR流量與普通流量的帶有負載的數(shù)據(jù)包的信息熵,并將計算出的信息熵作為樣本數(shù)據(jù)輸入決策樹模型進行二分類訓(xùn)練以提取出流量識別規(guī)則,將提取出的流量識別規(guī)則作為判定規(guī)則用于后續(xù)的流量識別操作;將未知流量作為識別對象,執(zhí)行流量識別操作,包括:計算識別對象的帶有負載的數(shù)據(jù)包的信息熵,依次匹配判定規(guī)則,命中則疑似度增加,否則疑似度減小,當(dāng)疑似度等于閾值時,則判定識別對象為SSR流量,本發(fā)明適用于各種組合配置的SSR服務(wù)識別。
技術(shù)領(lǐng)域
本發(fā)明涉及SSR流量識別領(lǐng)域,尤其涉及一種識別SSR流量的方法、系統(tǒng)以及計算機可讀存儲介質(zhì)。
背景技術(shù)
虛擬專用網(wǎng)(Virtual Private Network,VPN)技術(shù)作為加密網(wǎng)絡(luò)流量的主要使用技術(shù)之一,Shadowsocks(影梭,簡稱SS)屬于目前主流的VPN工具之一,基于TCP加密協(xié)議的代理工具,ShadowsocksR(簡稱SSR)是在SS的基礎(chǔ)上引入?yún)f(xié)議混淆、插件混淆,進一步對數(shù)據(jù)進行偽裝、混淆,成為SS的改進版。
由于VPN加密流量失去了原有流量的報文頭部信息、流量側(cè)信道特征信息,給網(wǎng)絡(luò)流量監(jiān)管帶來新的挑戰(zhàn)。現(xiàn)有的針對VPN加密流量的識別方法主要是基于DPI(深度包檢測)的流量識別及基于機器學(xué)習(xí)的流量識別,對于VPN流量的隨機化特點,機器學(xué)習(xí)(深度學(xué)習(xí))效果更加顯著,機器學(xué)習(xí)主要是對報文的長度、載荷、時間序列、流持續(xù)時間、流方向、速率等進行特征提取,采用隨機森林,SVM等模型進行訓(xùn)練識別,深度學(xué)習(xí)則主要是根據(jù)內(nèi)容特征,采用深度神經(jīng)網(wǎng)絡(luò)(CNN,SAE等)進行模型訓(xùn)練。由于ShadowsocksR支持?jǐn)?shù)據(jù)加密、協(xié)議混淆、插件混淆,其組合方式高達1000余種,目前大部分的識別技術(shù)沒有覆蓋所有配置,同時在真實網(wǎng)絡(luò)環(huán)境中,由于干擾流種類雜多,通過單一流的輸入進行識別,識別效果遠低于實驗室環(huán)境。
總而言之,現(xiàn)有的ShadowsocksR流量識別技術(shù),存在以下不足:
1)沒有涵蓋ShadowsocksR所有配置,不同協(xié)議加密、插件混淆會導(dǎo)致數(shù)據(jù)流的行為特征和內(nèi)容特征不一樣,現(xiàn)有的機器學(xué)習(xí)模型大多針對特定類型的Shadowsocks流量類型進行識別;
2)是由于模型輸入的單一性,現(xiàn)有識別技術(shù),都是直接判定單一流是否是Shadowsocks流量,在真實的網(wǎng)絡(luò)環(huán)境中,受干擾因素較多,導(dǎo)致準(zhǔn)確率不夠高。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述缺陷,提供一種識別SSR流量的方法、系統(tǒng)以及計算機可讀存儲介質(zhì)。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:構(gòu)造一種識別SSR流量的方法,所述方法包括:
搭建所有配置的SSR服務(wù),通過抓包工具抓取不同配置的SSR流量,以及采集普通流量;
計算抓取到的不同配置的SSR流量與普通流量的帶有負載的數(shù)據(jù)包的信息熵,并將計算出的信息熵作為樣本數(shù)據(jù)輸入決策樹模型進行二分類訓(xùn)練以提取出流量識別規(guī)則,將提取出的流量識別規(guī)則作為判定規(guī)則用于后續(xù)的流量識別操作;
將未知流量作為識別對象,執(zhí)行流量識別操作;
其中,流量識別操作包括:計算識別對象的帶有負載的數(shù)據(jù)包的信息熵,依次匹配判定規(guī)則,命中則疑似度增加,否則疑似度減小,當(dāng)疑似度等于閾值時,則判定識別對象為SSR流量。
優(yōu)選地,所述方法還包括,在提取出流量識別規(guī)則之后、將未知流量作為識別對象執(zhí)行流量識別操作之前,通過以下操作對流量識別規(guī)則進行優(yōu)化:將相似度較高的流量識別規(guī)則進行去重、合并,并統(tǒng)一采取大于/小于某一熵值為標(biāo)準(zhǔn),生成最終的判定規(guī)則。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市任子行科技開發(fā)有限公司,未經(jīng)深圳市任子行科技開發(fā)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110456660.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種SSR標(biāo)記引物設(shè)計方法、小麥SSR標(biāo)記引物
- 一種大批量開發(fā)SSR分子標(biāo)記的方法
- 一種檢測蝴蝶蘭突變體的方法
- 三七SSR標(biāo)記在皂苷Rd含量確定上的用途
- 一種用于鑒定蘋果新品種“赤霞”指紋圖譜的SSR分子標(biāo)記及其應(yīng)用
- SSR分子標(biāo)記引物、仙草品種的鑒定方法及試劑盒
- 用于區(qū)分鑒別薄殼山核桃與山核桃、大別山山核桃和湖南山核桃的SSR分子標(biāo)記及其應(yīng)用
- 一組菊科植物分子鑒定的葉綠體SSR標(biāo)記引物及其獲取方法
- 石蒜屬熒光EST-SSR分子標(biāo)記引物和鑒定石蒜屬種間雜交種F1代的方法及其應(yīng)用
- 一種菊花葉綠體基因組SSR標(biāo)記庫、其獲得方法及其應(yīng)用





