[發明專利]一種智能化自適應敏感數據識別系統及方法有效
| 申請號: | 201811469970.0 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109344258B | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 陳天瑩;李霄 | 申請(專利權)人: | 中國電子科技網絡信息安全有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/38;G06F40/30 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 錢成岑 |
| 地址: | 610041 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能化 自適應 敏感數據 識別 系統 方法 | ||
本發明提供的自適應的敏感數據識別方式,解決了大數據環境下敏感數據識別存在的問題;本解決了人工定義敏感數據和元數據工作繁重且效率低下的問題,有效提升了敏感數據識別的工作效率;本發明通過挖掘敏感數據的語義特征,提升了敏感數據識別的準確率;本發明結合基于文本內容、元數據與知識庫三種敏感數據識別方式,優化敏感數據識別流程,提升敏感數據識別的準確率與效率。本發明提出了敏感類型自適應管理,解決了新的敏感類型增加困難的問題,提升了敏感類型對實際需求的靈活適應程度。
技術領域
本發明涉及計算機技術與信息安全的交叉技術領域,具體是一種基于大數據的智能化敏感數據識別系統及方法。
背景技術
在大數據時代,數據規模龐大、增長迅速、類型繁多、結構各異,且描述不規范,且這些數據中包含大量敏感數據,且85%為非結構化數據,這對敏感數據識別的高效性和準確性都提出了巨大的挑戰。
傳統的敏感數據發現方式主要采用基于人工定義及正則表達式兩種方式。
1、基于人工定義的方式是通過定義關鍵詞或者元數據信息,之后匹配關鍵詞與元數據信息發現業務系統中的敏感數據;
2、基于正則表達式的方式是通過研究敏感數據的特征,按照敏感數據的結構組成規律,定義正則表達式,之后依據正則表達式匹配業務系統中的敏感數據。
但是隨著數據量暴增并且類型越趨復雜,傳統的敏感數據發現方式的弊端越來越明顯,主要問題如下:
1、人工定義敏感關鍵詞及元數據工作越來越繁重,且效率低下;
2、部分敏感數據具有結構特征,如身份證號、銀行卡號等敏感類型,可以采用正則表達式進行匹配,但是對于沒有結構特征的敏感數據,如地址、人名等敏感類型,無法采用正則表達式進行敏感數據發現;
3、正則表達式方式需要研究每類敏感數據的特征才能進行敏感數據發現,隨著敏感類型增加,正則表達式會越來越多,直接影響到敏感數據發現的效率,且規則庫維護困難,浪費資源;
4、基于正則表達式和人工定義敏感關鍵詞和元數據僅能識別符合規則及匹配成功的敏感數據,具有敏感語義的敏感數據會遺漏,降低敏感數據識別的準確率,無法防止敏感數據的泄露;
5、當敏感需求出現變動時,需要耗費大量時間和精力對新的敏感類型進行修改。
因此,在大數據背景下,亟需新的方式來提升敏感數據發現的準確率與效率。
發明內容
為了達到上述目的,本發明提出一種智能化自適應敏感數據識別系統及方法。
本發明的一種智能化自適應敏感數據識別系統,包括敏感類型自適應管理模塊、基于文本語義的敏感數據識別模塊、基于元數據自學習的敏感數據識別模塊、基于知識庫的智能敏感數據識別模塊、敏感知識庫與元數據動態配置模塊;所述敏感類型自適應管理模塊是根據實際場景中對敏感類型的需求自動添加與更新自定義敏感類型和脫敏算法、支持多敏感類型映射為一個敏感類型、支持敏感類型過濾的管理模塊;所述基于文本語義的敏感數據識別模塊是將敏感數據作為文本內容進行識別、采用基于規則和基于自然語言處理以及語義分析結合的方式自動識別文本中敏感數據的敏感數據識別模塊;所述基于元數據自學習的敏感數據識別模塊是采用元數據自學習的方式、不斷完善敏感數據的元數據信息并依據敏感數據的元數據信息進行敏感數據自動識別的敏感數據識別模塊;所述基于知識庫的智能敏感數據識別模塊是分析敏感數據的特征、構建敏感數據知識庫并通過實際應用不斷完善、依據知識庫信息自動識別敏感數據的敏感實際識別模塊;所述敏感知識庫與元數據動態配置模塊是將敏感知識庫與元數據動態配置實現敏感知識庫與元數據自動更新的配置模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技網絡信息安全有限公司,未經中國電子科技網絡信息安全有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811469970.0/2.html,轉載請聲明來源鉆瓜專利網。





