[發明專利]一種保持統計特征的算法在審
| 申請號: | 202010582944.X | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111752969A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 繆錢勇;劉金新;陳俊 | 申請(專利權)人: | 上海觀安信息技術股份有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/2458;G06F17/18;G06F21/62 |
| 代理公司: | 北京專贏專利代理有限公司 11797 | 代理人: | 李斌 |
| 地址: | 200333 上海市普陀區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 保持 統計 特征 算法 | ||
本發明公開了一種保持統計特征的算法,包含以下步驟:A、添加源數據庫;B、添加脫敏任務;C、配置保持統計特征算法;D、執行脫敏任務;E、對處理后的數據進行統計分析;采用本發明的算法,敏感數據經過該算法處理之后,仍然可以保持原來的統計特征,比如平均值與方差都不會發生變化,這樣這些數據仍然可以進行統計分析,就不用擔心這些數據脫敏處理后,失去分析的價值。
技術領域
本發明涉及數據安全業務領域,具體是一種保持統計特征的算法。
背景技術
隨著業務支撐系統的發展,敏感數據的安全保護也越發重要,因此如何有效的保護敏感數據的安全成為當前安全工作的重中之重。
針對敏感數據的安全保護,目前主要的方法是直接對敏感數據進行脫敏處理,為了不影響敏感數據的使用,脫敏算法一般選用高仿真算法。
目前對敏感數據繼續脫敏處理的脫敏算法大多是高仿真算法,這樣可以不影響敏感數據的使用,但是當這些數據需要進行統計分析的時候,比如求平均值,求方差,經過當前脫敏算法處理的數據將失去分析的價值。
發明內容
本發明的目的在于提供一種保持統計特征的算法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:
一種保持統計特征的算法,包含以下步驟:
A、添加源數據庫;
B、添加脫敏任務;
C、配置保持統計特征算法;
D、執行脫敏任務;
E、對處理后的數據進行統計分析。
作為本發明的進一步技術方案:步驟A具體是:添加含有需要進行統計分析的敏感數據的數據庫。
作為本發明的進一步技術方案:步驟B具體是:添加對需要進行統計分析的敏感數據脫敏處理的脫敏任務。
作為本發明的進一步技術方案:步驟C具體是:對需要進行統計分析的敏感數據配置保持統計特征的算法,保證敏感數據進行脫敏處理之后,仍然可以進行統計分析。
作為本發明的進一步技術方案:步驟D具體是:從源數據庫中拉取需要進行統計分析的敏感數據,對這些數據進行保持統計特征的算法處理。
作為本發明的進一步技術方案:具體處理方法為亂序處理,比如第一行數據放到第二行,第二行數據放到第三行,第三行數據放到第一行,依次類推,直到將所有數據都處理完畢。
作為本發明的進一步技術方案:步驟E具體是:取出脫敏處理后的數據并進行統計分析,如數據存在目標數據庫中,通過sql語句的sum語法進行求和,同時對原始數據進行求和,比較兩次的求和是否相同,如果兩次和相同,可以驗證算法生效了。
與現有技術相比,本發明的有益效果是:采用本發明的算法,敏感數據經過該算法處理之后,仍然可以保持原來的統計特征,比如平均值與方差都不會發生變化,這樣這些數據仍然可以進行統計分析,就不用擔心這些數據脫敏處理后,失去分析的價值。
具體實施方式
下面將對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
一種保持統計特征的算法,包含以下步驟:
A、添加源數據庫:添加含有需要進行統計分析的敏感數據的數據庫;
B、添加脫敏任務:添加對需要進行統計分析的敏感數據脫敏處理的脫敏任務;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海觀安信息技術股份有限公司,未經上海觀安信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010582944.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種業務連接方法及裝置
- 下一篇:顯示屏和顯示裝置





