[發明專利]一種可配置區域范圍和信息格式的地址脫敏方法在審
| 申請號: | 201711476813.8 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108268800A | 公開(公告)日: | 2018-07-10 |
| 發明(設計)人: | 馬佩;盛杰;李玉亮 | 申請(專利權)人: | 上海上訊信息技術股份有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 上海京滬專利代理事務所(普通合伙) 31235 | 代理人: | 楊金淑 |
| 地址: | 200120 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 脫敏 地址信息 字段 可配置區域 數據庫表 脫敏處理 信息格式 資源庫 地址信息識別 省份 地址相關 惡意攻擊 靈活設置 敏感信息 信息安全 直接獲取 變形的 真實度 外漏 匹配 替代 創建 | ||
本發明涉及一種可配置區域范圍和信息格式的地址脫敏方法,包括以下步驟:設置地址信息識別的規則;創建多級地址信息資源庫;設置脫敏后的地址中包含的省份范圍和地址級別;識別數據庫表中與地址相關的字段;將字段脫敏為與設置的地址級別相匹配的資源庫中的地址信息;將脫敏的地址信息替代至數據庫表中。本發明通過對包含地址的字段進行脫敏處理,以達到數據變形的效果,使得惡意攻擊者無法從經過脫敏處理的數據中直接獲取敏感信息,能夠有效的避免信息外漏,提高信息安全的可靠性;本發明能夠靈活設置脫敏地址的省份范圍及地址級別,脫敏后的地址信息真實度高。
技術領域
本發明涉及信息安全技術領域,尤其涉及一種可配置區域范圍和信息格式的地址脫敏方法。
背景技術
在很多企業的業務系統中,高可用的測試數據一般來源于生產系統,但是測試環境的安全防護遠沒有生產環境嚴格,存在信息泄露的風險,一旦發生數據泄露,將會給企業帶來極大的負面影響。因此需要有效的去除測試數據的敏感性以滿足信息保護的要求。
數據脫敏又稱為數據去隱私化或數據變形,是指針對數據中包含的秘密或隱私信息,如個人身份識別信息、商業機密數據等進行特殊處理,以達到數據變形的效果,使得惡意攻擊者無法從經過脫敏處理的數據中直接獲取敏感信息,從而實現對機密及隱私數據的防護。
目前針對地址信息的脫敏方法主要有以下幾種:
替代法:將地址信息的全部或部分內容替換為特定的字符串。
混洗法:對地址信息進行跨行隨機互換來打破其與本行其它數據的關聯關系。
加密法:對地址信息進行加密處理,使用戶只能看到加密后的無意義的數據。
遮擋法:對地址信息的部分內容用掩飾符(如“*”)進行統一替換,從而使地址信息保持部分內容公開。
上述四種方法雖然都能達到對地址信息脫敏的目的,但是脫敏后的地址信息真實度低且格式單一(如:替換法、遮擋法),對于大數據量的脫敏會產生很大的資源開銷(如:加密法)。
發明內容
本發明所要解決的技術問題是提供一種可配置區域范圍和信息格式的地址脫敏方法,脫敏后的地址信息真實度高且信息安全性高。
為解決上述技術問題,本發明的技術方案是:一種可配置區域范圍和信息格式的地址脫敏方法,包括以下步驟:
S1:設置地址信息識別的規則,用于識別數據庫表中與地址相關的字段;
S2:創建多級地址信息資源庫,所述資源庫包含省、市、縣(區)、鎮、村(社區)五個級別的地址信息,以及每級地址的隸屬關系及所包含的下一級的地址信息;
S3:設置脫敏后的地址中包含的省份范圍和地址級別;
S4:根據地址信息識別規則,識別數據庫表中與地址相關的字段;
S5:將所述字段脫敏為與設置的地址級別相匹配的資源庫中的地址信息;
S6:將脫敏的地址信息替代至數據庫表中。
作為優選的技術方案,地址信息識別規則的格式是:.*[省市區縣鎮鄉村街弄路].*。
作為優選的技術方案,步驟S4中,識別數據庫表中與地址相關的字段的方法是:選擇要進行信息識別的數據庫類型、數據庫名、數據表名;抽樣獲取數據表中的記錄信息,將抽樣記錄中每個字段的內容與地址識別規則進行匹配,若字段內容與規則相匹配,則所述字段保存的是地址信息,返回字段名。
作為優選的技術方案,還包括設置抽樣條數的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海上訊信息技術股份有限公司,未經上海上訊信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711476813.8/2.html,轉載請聲明來源鉆瓜專利網。





