[發明專利]一種敏感數據發現與檢測的方法及系統在審
| 申請號: | 202110025154.6 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112783602A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 韓浩 | 申請(專利權)人: | 韓浩 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455;H04L29/06 |
| 代理公司: | 北京市盈科律師事務所 11344 | 代理人: | 劉立國 |
| 地址: | 211800 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 敏感數據 發現 檢測 方法 系統 | ||
1.一種敏感數據發現與檢測的方法,其特征在于,所述方法包括以下步驟:
S1采集物理交換機鏡像端口流量、虛擬化環境采集虛擬機交換機端口鏡像流量、docker環境sidecar采集容器鏡像流量;
S2基于獲取的流量進行分析,構建完整會話流并提取應用請求和響應payload;
S3對應用層請求和響應payload進行分析處理;
S4識別結構化數據對象并作結構化處理;
S5利用關鍵字檢測和正則匹配進行敏感數據的敏感內容檢測;
S6記錄匹配內容及匹配結果和其在原文中的偏移量,有助于人工分析和調優。
2.根據權利要求1所述的敏感數據發現與檢測的方法,其特征在于,所述方法中,應用與應用、節點與節點的交互均通過網絡進行,并在數據鏈路層用MTU來限制所能傳輸的數據包大小,當發送的IP數據包的大小超過MTU時,IP層對數據進行分片處理,故而需要實現IP分片處理模塊用于重組分片的IP數據包。
3.根據權利要求1所述的敏感數據發現與檢測的方法,其特征在于,所述方法中,通過序列號、檢驗和、確認應答信號、重發控制、連接管理、窗口控制、流量控制、擁塞控制機制在鏡像流量中實現TCP會話流重組,進而提取TCP協議的數據段用于應用層協議自識別和應用層協議解析。
4.根據權利要求1所述的敏感數據發現與檢測的方法,其特征在于,所述方法中,利用HTTP協議層有限狀態機從鏡像流量中提取HTTP請求的Method、Header、URL、請求體、響應體信息;通過MYSQL協議層有限狀態機從鏡像流量中提取MYSQL請求的操作方法、SQL語句、請求體、響應體信息。
5.根據權利要求1所述的敏感數據發現與檢測的方法,其特征在于,所述方法中,通過HTTP Header解析模塊,判別數據交換協議類型,進而調用相對應的交換協議解析引擎;
通過JSON交互協議的協議解析引擎,將JSON格式的請求、響應的payload轉換成結構化數據對象;
通過XML交互協議的協議解析引擎,將XML格式的請求、響應的payload轉換成結構化數據對象;
通過protobuf交互協議的協議解析引擎,將protobuf格式的請求、響應的payload轉換成結構化數據對象;
通過MYSQL的請求分析模塊,識別存在數據傳輸的操作命令;
通過Row Data解析引擎,將MYSQL請求、響應的業務數據轉換成結構化數據對象。
6.根據權利要求1所述的敏感數據發現與檢測的方法,其特征在于,所述方法中,實現可與數據分級分類管理聯動的規則引擎,包括基于關鍵字和字典的元數據管理和基于正則匹配的主數據管理系統,并創建字典和正則疊加組合的規則體系用于支持復雜的數據分級分類規則。
7.根據權利要求1所述的敏感數據發現與檢測的方法,其特征在于,所述方法中,通過掃描引擎按需定制敏感數據檢測規則,并動態構建對應的規則掃描引擎,對待掃描的內容進行字符集檢查并轉換成UTF8編碼;
對轉換成UTF8編碼的待掃描內容運用字符串匹配算法實現關鍵字檢測;在關鍵字檢測結果基礎之上,運用更高層次的算法實現字典匹配結果的計算。
對轉換成UTF8編碼的待掃描內容運用正則匹配算法實現主數據檢測,對存在確定校驗算法的主數據,調用檢驗器檢測引擎。
8.根據權利要求1所述的敏感數據發現與檢測的方法,其特征在于,所述方法中,通過處理引擎對掃描結果進行處理,對于關鍵字匹配成功的結果,記錄匹配到的具體關鍵字以及關鍵字在待掃描內容中的偏移量,對主數據正則匹配成功的結果,記錄具體的匹配成功內容以及該內容在待掃描內容中的偏移量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于韓浩,未經韓浩許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110025154.6/1.html,轉載請聲明來源鉆瓜專利網。





