[發明專利]一種敏感數據識別和脫敏的裝置及方法有效
| 申請號: | 201611254013.7 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN108268785B | 公開(公告)日: | 2020-05-22 |
| 發明(設計)人: | 黃超;李青海;潘宇翔;王平;張曉亭;楊婉 | 申請(專利權)人: | 廣東精點數據科技股份有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 北京隆源天恒知識產權代理事務所(普通合伙) 11473 | 代理人: | 閆冬 |
| 地址: | 510630 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 敏感數據 識別 裝置 方法 | ||
本發明提供一種敏感數據識別和脫敏的裝置及方法,其裝置包括:輸入單元,用于響應當前觸發的數據脫敏請求,獲取待脫敏的目標數據;識別單元,用于識別待脫敏的目標數據是否為敏感數據,若是,則執行數據脫敏單元,否則直接執行輸出單元;所述數據脫敏單元,用于對已識別為敏感數據的目標數據執行脫敏操作;所述輸出單元,用于輸出處理后不具敏感性的目標數據。本發明的有益效果在于,利用NBM建立分類器實現對敏感數據的識別,避免對非敏感數據進行脫敏操作造成的運算負擔;采用變形和交換相結合的方法對敏感數據脫敏,只需對敏感數據中的小部分數據記錄按照脫敏規則進行數據變形,再利用交換實現對所有數據的脫敏,大大減少了運算量。
技術領域
本發明涉及信息安全領域,尤其涉及一種敏感數據識別和脫敏的裝置及方法。
背景技術
隨著信息技術的高速發展,信息安全問題日益突出。而商業銀行作為國家經濟發展核心支撐命脈的金融系統之一,其安全性備受全社會關注。隨著各類金融業務的快速發展,業務生產系統積累了大量賬戶、交易、經營管理等敏感信息的數據。如果這些敏感數據發生泄漏,不僅會讓客戶的個人隱私及賬戶安全受到威脅,而且也可能給銀行的業務運營和系統運營安全帶來隱患。所以敏感數據的保護成為商業銀行信息安全管理的重點。
為了使敏感數據得到保護,需要對這些數據進行脫敏處理,以使其喪失敏感性后再運用到開發和測試環境中,避免敏感數據的泄漏。數據脫敏,是指對某些敏感信息通過脫敏規則進行數據的變形。但是由于商業銀行數據的龐大,如果要對每一條數據都按照一定的脫敏規則進行脫敏,運算量大且效率較低,鑒于此,在進行數據脫敏前對數據進行識別并對脫敏規則進行改進是非常有必要的。
鑒于上述缺陷,本發明創作者經過長時間的研究和實踐終于獲得了本發明。
發明內容
為解決上述問題,本發明采用的技術方案在于,一方面,提供一種敏感數據識別和脫敏的裝置,包括:輸入單元、識別單元、數據脫敏單元和輸出單元;所述輸入單元,用于響應當前觸發的數據脫敏請求,獲取待脫敏的目標數據;所述識別單元,用于識別所述待脫敏的目標數據是否為敏感數據,若是,則執行所述數據脫敏單元,否則直接執行所述輸出單元;所述數據脫敏單元,用于對已識別為所述敏感數據的目標數據執行脫敏操作;所述輸出單元,用于輸出處理后不具敏感性的目標數據。
進一步,所述識別單元,包括預處理子單元、機器學習子單元和判斷子單元;所述預處理子單元,用于特征提取,將訓練集中的數據表征出來;所述機器學習子單元,其利用NBM在所述訓練集上進行機器學習后得到分類器;所述判斷子單元,其將輸入的數據用所述預處理子單元構建的特征向量表征出來后用所述分類器進行分類,判定是否為敏感數據。
進一步,所述預處理子單元,包括分離模塊,構建模塊和表征模塊;所述分離模塊,用于讀取歷史數據作為所述訓練集,并從所述訓練集中分離部分數據作為測試集;所述構建模塊,用于構建所述訓練集中數據的特征向量;所述表征模塊,用于根據構建好的所述特征向量將所述訓練集中的數據表征出來。
進一步,所述機器學習子單元,包括第一計算模塊、第二計算模塊和測試與評價模塊;
所述第一計算模塊,假設所述訓練集={(x1,c1),...,(xn,cn)}包含n條數據,其中表示第i條數據的特征向量,a1,...,aM為所述預處理子單元提取的特征屬性,ci∈{0,1}表示第i條數據的類別,0表示該數據為敏感數據,1表示該數據為非敏感數據,計算類別c=0和c=1的先驗概率:
所述第二計算模塊,計算某個特征屬性xj=ak分別在類別c=0和c=1下的條件概率:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東精點數據科技股份有限公司,未經廣東精點數據科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611254013.7/2.html,轉載請聲明來源鉆瓜專利網。





