[發明專利]一種基于HTTP不同版本的加密網站細粒度分類方法和裝置在審
| 申請號: | 202010090768.8 | 申請日: | 2020-02-13 |
| 公開(公告)號: | CN111382780A | 公開(公告)日: | 2020-07-07 |
| 發明(設計)人: | 熊剛;茍高鵬;張子青;李鎮;管洋洋;王炳旭 | 申請(專利權)人: | 中國科學院信息工程研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/00;G06N3/04;H04L29/08 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 http 不同 版本 加密 網站 細粒度 分類 方法 裝置 | ||
本發明涉及一種基于HTTP不同版本的加密網站細粒度分類方法和裝置。該方法包括以下步驟:對待分類的加密網站建立本地請求和響應序列特征;將待分類的加密網站的本地請求和響應序列特征輸入深度森林模型;所述深度森林模型是利用由訓練數據建立的網頁的本地請求和響應序列特征進行訓練而得到的深度森林模型;通過深度森林模型得到加密網站細粒度分類結果本發明可以對使用不同版本的HTTP協議的加密網站進行分類,既適用于粗粒度網站指紋,即對不同網站的主頁分類,也適用于細粒度網站指紋,即對同一個網站下不同網頁分類;不僅可以在雙向流場景中使用,也可以在單向流場景中使用。
技術領域
本發明涉及一種基于HTTP不同版本的加密網站細粒度分類方法和裝置,屬于計算機軟件技術領域。
背景技術
隨著加密協議如SSL/TLS的廣泛使用,傳統的基于包內容的方法很難識別網絡流量。因此,最近的研究對網絡流量提取了各種特征并使用機器學習算法進行分類。加密網站細粒度分類是指利用流量的基本時空特征、行為特征和協議特征在加密信道中精細化地識別特定加密Web網頁,又稱為網站指紋技術。
以前的網站指紋工作只是對基于HTTP/1.1的加密網站分類。據W3Techs稱,截至2019年1月,前1000萬網站中有32.5%支持HTTP/2.0。SearchDatalogy還報告,在2018年4月的200個頂級網站中,44%的網站支持HTTP/2.0。HTTP/2.0中的多路復用和并發技術導致HTTP/2.0與以前版本的HTTP協議有很大的不同。以往關于網站指紋的研究主要集中在基于HTTP/1.0和HTTP/1.1的特征上,這些特征不適用于HTTP/2.0協議。隨著技術的發展,HTTP/2被廣泛使用。HTTP/2中的復用和并發技術使得它與HTTP/1.1有很大的不同。因此需要提出既適用于HTTP/1.1網站也適用于HTTP/2網站的特征。
另外,現有的大部分工作僅僅對每個網站的主頁進行分類,但事實上,用戶也訪問網站的其他頁面。幾乎所有傳統的機器學習算法都沒有充分利用網絡流量中天然具有的時序特性。
發明內容
本發明針對上述問題,提供一種基于HTTP不同版本的加密網站細粒度分類方法和裝置。
為了解決特征兼容性問題,本發明使用本地請求和響應序列(Local Request andResponse Sequence,簡稱LRRS)作為特征。由于使用了局部序列,LRRS不僅可以適用于使用不同版本HTTP的加密網站,還可以從不同的細粒度角度描述流量。
本發明在處理特征時使用卷積,它可以通過滑動窗口學習特征中的順序關系。為了在同一個網站上對不同的網頁進行指紋識別,本發明引入了深度森林來提取細粒度特征。它采用卷積結構,充分利用了LRRS序列特征;另外深度森林使用了多層結構,增強了特征表示能力。
本發明采用的技術方案如下:
一種基于HTTP不同版本的加密網站細粒度分類方法,包括以下步驟:
對待分類的加密網站建立本地請求和響應序列特征;
將待分類的加密網站的本地請求和響應序列特征輸入深度森林模型;所述深度森林模型是利用由訓練數據建立的網頁的本地請求和響應序列特征進行訓練而得到的深度森林模型;
通過深度森林模型得到加密網站細粒度分類結果。
進一步地,所述本地請求和響應序列特征包括三部分:第一部分特征描述網頁的整體統計特征;第二部分特征包含頁面加載期間每個時間片中傳入和傳出數據包的數量和總大小;第三部分特征描述網頁的詳細信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所,未經中國科學院信息工程研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010090768.8/2.html,轉載請聲明來源鉆瓜專利網。





