[發明專利]敏感數據掃描方法和系統有效
| 申請號: | 202010565631.3 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111737742B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 王若曾 | 申請(專利權)人: | 建信金融科技有限責任公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F9/54;G06F16/25 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200120 上海市浦東新區中國(*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 敏感數據 掃描 方法 系統 | ||
1.一種敏感數據掃描方法,其特征在于,包括:
數據采樣模塊讀取目標數據庫中的數據樣本,并將所述數據樣本發送到消息中間件;
所述消息中間件將所述數據樣本進行存儲;
掃描節點集群中的每個掃描節點從所述消息中間件中讀取所述數據樣本,并對所述數據樣本進行掃描,得到敏感數據;
所述掃描節點集群中的每個掃描節點對所述數據樣本進行掃描,得到敏感數據,包括:掃描節點集群中的每個掃描節點確定所述數據樣本的長度;如果所述數據樣本的長度超過設定長度閾值,所述每個掃描節點采用文本分類器對所述數據樣本進行敏感數據分類;如果所述數據樣本的長度未超過設定長度閾值,所述每個掃描節點采用至少一個正則表達式分別對所述數據樣本進行敏感數據篩選;其中,所述至少一個正則表達式分別為不同種類敏感數據的篩選邏輯公式。
2.根據權利要求1所述的方法,其特征在于,所述數據采樣模塊讀取目標數據庫中的數據樣本,包括:
數據采樣模塊讀取目標數據庫的元數據;
所述數據采樣模塊根據所述元數據確定讀取范圍,并讀取所述讀取范圍內的數據樣本。
3.根據權利要求2所述的方法,其特征在于,在所述數據采樣模塊讀取所述讀取范圍內的數據樣本之后,還包括:
所述數據采樣模塊對所述讀取范圍內的數據樣本進行設定處理,得到所述數據樣本;
其中,所述設定處理包括設定類型字段的過濾處理、空數據樣本過濾處理和去重處理中的至少一項。
4.根據權利要求1所述的方法,其特征在于,在所述數據采樣模塊讀取目標數據庫中的數據樣本之前,還包括:
功能接口層獲取目標數據庫的信息,并將所述目標數據庫的信息存儲至配置數據庫中;
所述數據采樣模塊讀取目標數據庫中的數據樣本,包括:
數據采樣模塊從所述配置數據庫中讀取所述目標數據庫的信息,并根據所述目標數據庫的信息鏈接所述目標數據庫;
數據采樣模塊從鏈接到的所述目標數據庫讀取數據樣本。
5.根據權利要求4所述的方法,其特征在于,在所述功能接口層將所述目標數據庫的信息存儲至配置數據庫中之后,還包括:
所述配置數據庫將所述目標數據庫的掃描狀態設置為待掃描;
所述配置數據庫響應于所述數據采樣模塊發送的執行狀態信息,設置所述目標數據庫的掃描狀態。
6.根據權利要求1-5任一項所述的方法,其特征在于,在所述掃描節點集群中的每個掃描節點對所述數據樣本進行掃描,得到敏感數據之后,還包括:
所述每個掃描節點將所述敏感數據存儲至緩存;
同步模塊將所述敏感數據從所述緩存中同步至掃描結果數據庫。?
7.根據權利要求6所述的方法,其特征在于,在所述同步模塊將所述敏感數據從所述緩存中同步至掃描結果數據庫之后,還包括:
功能接口層獲取所述掃描結果數據庫的存儲數據量;
所述功能接口層獲取所述掃描節點集群掃描到的敏感數據的數據量;
如果所述存儲數據量和所述敏感數據的數據量之差在設定范圍內,所述功能接口層生成掃描報告,并將配置數據庫中所述目標數據庫的掃描狀態設置為掃描結束。
8.一種敏感數據掃描系統,其特征在于,包括:
數據采樣模塊,用于讀取目標數據庫中的數據樣本,并將所述數據樣本發送到消息中間件;
所述消息中間件,用于將所述數據樣本進行存儲;
掃描節點集群,用于通過所述集群中的每個掃描節點從所述消息中間件中讀取所述數據樣本,并對所述數據樣本進行掃描,得到敏感數據;
掃描節點集群中的每個掃描節點對所述數據樣本進行掃描,得到敏感數據,包括:掃描節點集群中的每個掃描節點確定所述數據樣本的長度;如果所述數據樣本的長度超過設定長度閾值,所述每個掃描節點采用文本分類器對所述數據樣本進行敏感數據分類;如果所述數據樣本的長度未超過設定長度閾值,所述每個掃描節點采用至少一個正則表達式分別對所述數據樣本進行敏感數據篩選;其中,所述至少一個正則表達式分別為不同種類敏感數據的篩選邏輯公式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于建信金融科技有限責任公司,未經建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010565631.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種交互過程的控制方法、裝置、存儲介質及設備
- 下一篇:一種光學鏡頭





