[發明專利]基于隨機森林的協議加密算法類型識別方法在審
| 申請號: | 201910368967.8 | 申請日: | 2019-05-05 |
| 公開(公告)號: | CN110138849A | 公開(公告)日: | 2019-08-16 |
| 發明(設計)人: | 楊武 | 申請(專利權)人: | 哈爾濱英賽克信息技術有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08;H04L29/06;H04L9/08;G06K9/62;H04L9/14 |
| 代理公司: | 哈爾濱龍科專利代理有限公司 23206 | 代理人: | 高媛 |
| 地址: | 150000 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 隨機森林 決策樹 加密算法 分類結果 加密類型 加密應用 訓練子集 結點 應用密文 分析 采樣法 測試集 訓練集 構建 密文 互聯網 投票 | ||
1.一種基于隨機森林的協議加密算法類型識別方法,其特征在于所述方法包括如下步驟:
步驟一、訓練階段:
(1)從HTTPS數據流中提取加密應用數據,分析提取密文特性并構建特征,組成具有M維的特征F={f1,f2,...,fM},M=11,通過該方式將原始數據處理為可以被隨機森林識別的數據集;
(2)將訓練集輸入到包含10棵C4.5決策樹的隨機森林中,每棵決策樹使用自助采樣法選取訓練子集T′;
(3)每棵決策樹在訓練時,隨機丟棄部分特征維度,使用剩下的特征F′進行信息增益比的判斷,直到每個結點上的樣本個數小于閾值;
(4)當所有決策樹訓練完畢后,選擇結點上占比最大的加密類型作為該結點的加密類型;
步驟二、測試階段:
(1)將測試集按照不同協議類型分開,針對其中的HTTPS協議,作為隨機森林測試集;
(2)將測試集的樣本數據輸入到使用HTTPS協議應用密文訓練的隨機森林模型中;
(3)隨機森林中的每棵決策樹給出分類結果,依據相對多數投票法則選出最終的分類結果。
2.根據權利要求1所述的基于隨機森林的協議加密算法類型識別方法,其特征在于所述決策樹訓練完畢的標志為每棵樹的節點在樣本點純度上都達到給定的要求。
3.根據權利要求1所述的基于隨機森林的協議加密算法類型識別方法,其特征在于所述隨機森林的算法流程如下所示:
a、在訓練集T中,使用自助抽樣法的有放回的選擇樣本,組成訓練子集T′;
b、對于訓練子集T′,從特征F中抽取m個特征,作為決策樹分裂的依據,從根結點起始,自上到下生成決策樹;
c、重復多次步驟a、b,得到n個訓練子集,訓練得到n個決策樹,即隨機森林訓練完畢;
d、測試集中有λ個測試樣本,將測試集D的樣本之一輸入到隨機森林中,讓每個決策樹對樣本進行決策,使用相對多數投票法對決策結果進行投票決定樣本的類別,相對多數投票法會選擇最多的投票結果作為隨機森林最終的分類結果,若有多個標記獲得最高票,則隨機選取一個最高票作為最終結果;
e、重復步驟dλ次,直到所有測試樣本分類完畢。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱英賽克信息技術有限公司,未經哈爾濱英賽克信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910368967.8/1.html,轉載請聲明來源鉆瓜專利網。





