[發明專利]一種敏感數據識別和脫敏的裝置及方法有效
| 申請號: | 201611254013.7 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN108268785B | 公開(公告)日: | 2020-05-22 |
| 發明(設計)人: | 黃超;李青海;潘宇翔;王平;張曉亭;楊婉 | 申請(專利權)人: | 廣東精點數據科技股份有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 北京隆源天恒知識產權代理事務所(普通合伙) 11473 | 代理人: | 閆冬 |
| 地址: | 510630 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 敏感數據 識別 裝置 方法 | ||
1.一種敏感數據識別和脫敏的裝置,其特征在于,包括:
輸入單元、識別單元、數據脫敏單元和輸出單元;
所述輸入單元,用于響應當前觸發的數據脫敏請求,獲取待脫敏的目標數據;
所述識別單元,用于識別所述待脫敏的目標數據是否為敏感數據,若是,則執行所述數據脫敏單元,否則直接執行所述輸出單元;
所述數據脫敏單元,用于對已識別為所述敏感數據的目標數據執行脫敏操作,所述數據脫敏單元包括第一生成子單元、記載子單元、第二生成子單元、交換子單元和對比子單元,其中:
所述第一生成子單元,用于生成隨機數N,NM,M表示數據記錄的條數;
所述記載子單元,用于從所述M條數據記錄中隨機選取出所述N條數據記錄,按照自定義的變形規則對數據進行變形,并將N條變形后的數據記錄裝載回原來的位置;
所述第二生成子單元,用于生成隨機數n,nM,M表示數據記錄的條數;
所述交換子單元,用于將所述M條數據記錄中的第i條數據記錄和所述第n條數據記錄進行交換,i=1;
對比子單元,用于對比i是否大于M,若iM,則輸出目標數據,若i≤M,則對所述M條數據記錄中的每一條數據重復進行所述第二生成子單元和所述交換子單元,所述交換子單元的i=i+1;
所述輸出單元,用于輸出處理后不具敏感性的目標數據。
2.根據權利要求1所述的敏感數據識別和脫敏的裝置,其特征在于,所述識別單元,包括預處理子單元、機器學習子單元和判斷子單元;
所述預處理子單元,用于特征提取,將訓練集中的數據表征出來;
所述機器學習子單元,其利用NBM在所述訓練集上進行機器學習后得到分類器;
所述判斷子單元,其將輸入的數據用所述預處理子單元構建的特征向量表征出來后用所述分類器進行分類,判定是否為敏感數據。
3.根據權利要求2所述的敏感數據識別和脫敏的裝置,其特征在于,所述預處理子單元,包括分離模塊,構建模塊和表征模塊;
所述分離模塊,用于讀取歷史數據作為所述訓練集,并從所述訓練集中分離部分數據作為測試集;
所述構建模塊,用于構建所述訓練集中數據的特征向量;
所述表征模塊,用于根據構建好的所述特征向量將所述訓練集中的數據表征出來。
4.根據權利要求3所述的敏感數據識別和脫敏的裝置,其特征在于,所述機器學習子單元,包括第一計算模塊、第二計算模塊和測試與評價模塊;
所述第一計算模塊,假設所述訓練集={(x1,c1),…,(xn,cn)}包含n條數據,其中表示第i條數據的特征向量,a1,...,aM為所述預處理子單元提取的特征屬性,ci∈{0,1}表示第i條數據的類別,0表示該數據為敏感數據,1表示該數據為非敏感數據,計算類別c=0和c=1的先驗概率:
所述第二計算模塊,計算某個特征屬性xj=ak分別在類別c=0和c=1下的條件概率:
所述測試與評價模塊,用于在所述測試集上進行測試和評價。
5.根據權利要求4所述的敏感數據識別和脫敏的裝置,其特征在于,所述測試與評價模塊包括讀取子模塊、計算子模塊、確定子模塊和比較子模塊;
所述讀取子模塊,用于讀取所述測試集上的一條數據X,并表征成特征向量;
所述計算子模塊,分別計算類別c=0和c=1在所述數據X下的后驗概率:
由于P(X)對于類別c=0和c=1為常數,所以只需計算分子的概率;
所述確定子模塊,用于確定所述數據X屬于的分類c:
c=arg max P(c=ck|X);
所述比較子模塊,用于對所述測試集中的每一條數據重復所述讀取子模塊、所述計算子模塊和所述確定子模塊,并與給定的分類進行比較,得到誤分類率,若所述誤分類率在設定范圍內,則生成所述分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東精點數據科技股份有限公司,未經廣東精點數據科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611254013.7/1.html,轉載請聲明來源鉆瓜專利網。





