[發(fā)明專利]一種加密流量分類方法、系統(tǒng)、設(shè)備及可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110437302.5 | 申請日: | 2021-04-22 |
| 公開(公告)號: | CN113095426B | 公開(公告)日: | 2023-03-31 |
| 發(fā)明(設(shè)計)人: | 馬小博;劉東錦;瞿建;卞華峰;王鑫;潘鵬宇;李森 | 申請(專利權(quán))人: | 西安交通大學(xué) |
| 主分類號: | G06F18/2431 | 分類號: | G06F18/2431;G06F18/214;G06F18/25;H04L47/2441 |
| 代理公司: | 西安通大專利代理有限責(zé)任公司 61200 | 代理人: | 朱海臨 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 加密 流量 分類 方法 系統(tǒng) 設(shè)備 可讀 存儲 介質(zhì) | ||
本發(fā)明公開一種加密流量分類方法、系統(tǒng)、設(shè)備及可讀存儲介質(zhì),通過采用袋外數(shù)據(jù)對預(yù)訓(xùn)練模型的模型特征進(jìn)行重要性度量,得到模型特征重要性排序,取模型特征排序結(jié)果效果最好的前UN個模型特征作為預(yù)訓(xùn)練模型的有效特征,提取出的特征能準(zhǔn)確刻加密流量的特點,以提取出的數(shù)值特征訓(xùn)練預(yù)訓(xùn)練模型,能夠提高加密流量分類的準(zhǔn)確性,采用主被動探測結(jié)合的方式提取特征,能極大的提高加密流量分類的準(zhǔn)確性,提高了特征的全面性,基于所提取的特征,構(gòu)建加密流量分類方法,有效特征提高了特征的精簡性,有效特征的全面性和精簡性,節(jié)省分類模型構(gòu)建的時間和空間成本,提高檢測效率和精準(zhǔn)度,同時也能提高分類的準(zhǔn)確率,有利于互聯(lián)網(wǎng)安全分類的使用。
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)絡(luò)安全與用戶隱私領(lǐng)域,特別涉及一種加密流量分類方法、系統(tǒng)、設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
近年來,隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)已經(jīng)緊密地融入我們的生產(chǎn)與生活,網(wǎng)絡(luò)安全也成為一個不可忽視的問題。在日常生活中,人們的網(wǎng)絡(luò)安全意識也逐漸提高,越來越多的用戶和企業(yè)開始重視信息的保護(hù)和安全傳輸。基于加密流量的分類技術(shù),可以用來實現(xiàn)網(wǎng)絡(luò)的安全監(jiān)管,特別是非法業(yè)務(wù)和不良信息的監(jiān)管。加密流量分類可以分析出用戶使用的加密代理流量類別,目前,加密流量的分析主要是基于網(wǎng)站指紋識別技術(shù)。網(wǎng)站指紋識別就是一種基于機器學(xué)習(xí)算法識別通過加密方式訪問的網(wǎng)站,通過對網(wǎng)絡(luò)流量的特征提取并結(jié)合有監(jiān)督的分類技術(shù)對網(wǎng)站進(jìn)行分類的技術(shù)。其中,這種技術(shù)的關(guān)鍵就在于通過提取的特征對能夠?qū)W(wǎng)站分類的分類模型的構(gòu)建過程,所以提取的特征對加密流量分類的準(zhǔn)確性有較大的影響,而目前基于加密流量的分類技術(shù)基于特征提取比較繁瑣,而且準(zhǔn)確率低。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種加密流量分類方法、系統(tǒng)、設(shè)備及可讀存儲介質(zhì),以克服現(xiàn)有技術(shù)的不足。
為達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案:
一種加密流量分類方法,包括以下步驟:
S1,采用袋外數(shù)據(jù)對預(yù)訓(xùn)練模型的模型特征進(jìn)行重要性度量,得到模型特征重要性排序,取模型特征排序結(jié)果效果最好的前UN個模型特征作為預(yù)訓(xùn)練模型的有效特征;
S2,利用有效特征對預(yù)訓(xùn)練模型進(jìn)行優(yōu)化訓(xùn)練,得到最終的加密流量分類器模型,利用加密流量分類器模型進(jìn)行加密流量的分類。
進(jìn)一步的,預(yù)訓(xùn)練模型采用樣本集合進(jìn)行預(yù)訓(xùn)練。
進(jìn)一步的,預(yù)訓(xùn)練模型具體通過以下方法獲得:
a、采集加密流量樣本集合,加密流量樣本集合中的每一個加密流量樣本為原始流量文件;對原始流量文件進(jìn)行預(yù)處理,分離匿名代理工具產(chǎn)生的流量,篩選有效流,統(tǒng)一流量方向,得到加密流量序列;
b、根據(jù)加密流量獲取被動探測特征和主動探測特征,利用獲取的被動探測特征和主動探測特征對隨機森林模型進(jìn)行訓(xùn)練,得到預(yù)訓(xùn)練模型。
進(jìn)一步的,原始流量文件包括數(shù)據(jù)包和唯一的加密流量類型標(biāo)簽,加密流量序列包括服務(wù)器地址、目標(biāo)端口號、傳輸所用的協(xié)議號、流量起止時間、流量上下行字節(jié)數(shù)和上下行數(shù)據(jù)包的數(shù)目。
進(jìn)一步的,被動探測特征包括基礎(chǔ)特征N、時間維度特征、空間維度特征、首荷載包的ASCII碼均值特征和首段數(shù)據(jù)包荷載分布特征四種衍生特征。
進(jìn)一步的,主動探測特征包括遠(yuǎn)程主機的whois信息和端口信息;根據(jù)數(shù)據(jù)包的遠(yuǎn)程主機IP地址對遠(yuǎn)程主機進(jìn)行掃描得到用于加密流量分類器模型訓(xùn)練的主動探測特征。
進(jìn)一步的,以得到的加密流量樣本的有效特征序列LU作為輸入,訓(xùn)練隨機森林分類模型得到最終分類模型;將待分類的加密流量數(shù)據(jù)進(jìn)行預(yù)處理得到待分類加密流量序列,將待分類的加密流量數(shù)據(jù)和待分類加密流量序列輸入最終分類模型中,加密流量分類器模型綜合所有決策樹的獨立判定結(jié)果輸出綜合判定結(jié)果。
一種加密流量分類系統(tǒng),包括預(yù)訓(xùn)練模塊和分類器模塊,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安交通大學(xué),未經(jīng)西安交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110437302.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 加密裝置、加密系統(tǒng)、加密方法以及加密程序
- 移動終端和方法
- 再加密方法、再加密系統(tǒng)以及再加密裝置
- 加密終端遠(yuǎn)程管理的方法、加密終端及管理器
- 數(shù)據(jù)加密的方法及裝置
- 流媒體數(shù)據(jù)加密、解密方法、裝置、電子設(shè)備及存儲介質(zhì)
- 加密裝置、加密系統(tǒng)和數(shù)據(jù)的加密方法
- 文件加密、解密方法、裝置、設(shè)備和存儲介質(zhì)
- 一種車聯(lián)網(wǎng)數(shù)據(jù)加密方法及系統(tǒng)
- 一種服務(wù)數(shù)據(jù)共享云平臺的數(shù)據(jù)加密方法及系統(tǒng)





