[發明專利]流式數據的特征提取方法及裝置、存儲介質、計算機設備有效
| 申請號: | 202110999767.X | 申請日: | 2021-08-30 |
| 公開(公告)號: | CN113452581B | 公開(公告)日: | 2021-12-14 |
| 發明(設計)人: | 辜乘風;徐明;魏國富;殷錢安;周曉勇;陶景龍;余賢喆;梁淑云;劉勝;王啟凡;馬影 | 申請(專利權)人: | 上海觀安信息技術股份有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;G06N20/00;G06K9/62;G06F16/2455;G06F16/22 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 200000 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 特征 提取 方法 裝置 存儲 介質 計算機 設備 | ||
1.一種流式數據的特征提取方法,其特征在于,包括:
接收流式數據,并獲取所述流式數據對應的網絡安全特征提取需求,其中,所述網絡安全特征提取需求包括至少一個待提取的目標維度以及至少一個待提取的目標特征,所述目標維度包括IP維度、時間維度以及mac局域網地址維度中的至少一種,所述目標特征包括DNS請求數量特征、ICMP請求數量特征、HTTP請求數量特征、DNS域名集合特征以及頁面訪問次數特征中的至少一種;
依據所述目標維度以及所述目標特征,生成特征數據提取器;
利用所述特征數據提取器,提取所述流式數據中與所述目標維度以及所述目標特征對應的網絡安全特征數據;
所述依據所述目標維度以及所述目標特征,生成特征數據提取器,具體包括:
分別依據每個目標特征,建立與所述每個目標特征各自匹配的特征數據提取工具;依據所述目標維度、所述目標特征以及所述特征數據提取工具,生成所述特征數據提取器,其中,所述特征數據提取器包括提取器頭部以及提取器主體,所述提取器頭部用于指示所述目標維度以及所述目標特征,所述提取器主體包括所述特征數據提取工具。
2.根據權利要求1所述的方法,其特征在于,所述網絡安全特征提取需求包括請求DNS域名去重數量,所述請求DNS域名去重數量包括所述IP維度以及所述DNS域名集合特征。
3.根據權利要求1所述的方法,其特征在于,所述獲取所述流式數據對應的網絡安全特征提取需求之前,所述方法還包括:
依據預設數據篩選條件,對所述流式數據進行篩選,其中,所述預設數據篩選條件包括預設數據協議。
4.根據權利要求1所述的方法,其特征在于,所述利用所述特征數據提取器,提取所述流式數據中與所述目標維度以及所述目標特征對應的網絡安全特征數據,具體包括:
將所述流式數據輸入到所述特征數據提取器中,以使所述特征數據提取器按所述目標維度對所述流式數據進行分組,并從分組后的流式數據中提取出與所述目標特征匹配的網絡安全特征數據。
5.根據權利要求1所述的方法,其特征在于,所述提取所述流式數據中與所述目標維度以及所述目標特征對應的網絡安全特征數據之后,所述方法還包括:
基于所述特征數據提取器的提取器頭部以及所述網絡安全特征數據,生成特征數據集合列表,其中,所述特征數據集合列表包括第一表頭、第二表頭以及與每個第一表頭和每個第二表頭對應的列表結果,所述第一表頭包括所述目標維度,所述第二表頭包括所述目標特征,所述列表結果包括與每個目標維度和每個目標特征對應的所述網絡安全特征數據。
6.根據權利要求5所述的方法,其特征在于,所述生成特征數據集合列表之后,所述方法還包括:
響應于樣本數據獲取指令,從所述特征數據集合列表中查找與所述樣本數據獲取指令相對應的目標特征數據,其中,所述樣本數據獲取指令包括任意第一表頭和/或任意第二表頭,所述樣本數據獲取指令用于獲取模型訓練樣本;
判斷所述目標特征數據是否為數值型數據,并當所述目標特征數據為非數值型數據時,基于所述目標特征數據的數據類型,調用對應的數據處理模型;
依據所述數據處理模型,將所述目標特征數據轉化為數值型數據,以利用轉化后的目標特征數據進行模型訓練。
7.根據權利要求5所述的方法,其特征在于,所述基于所述特征數據提取器的提取器頭部以及所述網絡安全特征數據,生成特征數據集合列表之前,所述方法還包括:
判斷所述網絡安全特征數據是否為數值型數據,并當所述網絡安全特征數據為非數值型數據時,基于所述網絡安全特征數據的數據類型,調用對應的數據處理模型;
依據所述數據處理模型,將所述網絡安全特征數據轉化為數值型數據,以利用轉化后的網絡安全特征數據生成特征數據集合列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海觀安信息技術股份有限公司,未經上海觀安信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110999767.X/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





