[發明專利]一種數據脫敏的方法及裝置有效
| 申請號: | 202010071239.3 | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111241587B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 張美躍;周業;陳佳偉;周定云;俞宏青;俞基鋒 | 申請(專利權)人: | 恒瑞通(福建)信息技術有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 北京易捷勝知識產權代理有限公司 11613 | 代理人: | 蔡曉敏 |
| 地址: | 350300 福建省福州市晉安區新*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 方法 裝置 | ||
本發明提供的一種數據脫敏的方法及裝置,通過獲取原始數據,并進行核化處理,得到新的數據;對所述新的數據進行降維處理,得到降維后的數據,不僅去除了數據中的冗余信息,簡化了計算復雜度,減少不必要開銷;對所述降維后的數據進行中心化處理,得到脫敏后的數據,在保證數據的可用性的前提下保護隱私數據。
技術領域
本發明涉及數據處理技術領域,特別涉及一種數據脫敏的方法及裝置。
背景技術
近年來,隨著信息技術的不斷發展,個人數據的產生呈指數型增長,大量的個人信息被政府部分、商業機構等存儲、發布。數據發布作為信息共享的一種手段,在為數據交換和數據共享提供便利的同時,也增大了個人隱私數據泄露的風險。“隱私數據”即指數據擁有者不愿意其他人知道的敏感信息,如家庭地址、身份證號碼、電話號碼、疾病信息、位置信息等。例如,有關部門可能為了研究各類型藥物的使用量以及病人的患病情況等原因,需要醫院提供相關的購藥表數據,而購藥表數據中包含許多的隱私數據。顯然,如果將購藥表數據直接發布,則可能會泄露病人的隱私信息。如何對表數據進行處理,以防止病人的疾病隱私泄露,最簡單的辦法就是將患者的名字屬性去掉,則攻擊性可能根據敏感屬性,借助背景知識、關聯攻擊等方式推斷出個人的身份信息。如果把數據中的敏感屬性全部去掉,那么這樣的數據會導致研究變得毫無意義。
目前,關于在數據發布中的隱私泄露問題,現有的研究主要是通過限制數據發布、數據加擾、k-匿名等方法,雖然這些方法能在一定程度上保護數據的隱私,但是還存在著一些安全性和可用性缺陷。比如,限制數據發布主要是切斷數據之間的關聯,但其將會導致數據的可用性降低,而且限制發布的數據個數也不好控制;數據加擾主要是對數據進行擾動,通過增加適當的噪音來改變數據,有利于數據特征的維持,但是其有較低的聚類可用性,并且計算開銷大;k-匿名主要是要求發布的數據中至少存在k個不可區分的記錄,使攻擊者不能判別出隱私信息所屬的具體個體,從而保護了個人隱私,雖然k-匿名在一定程度上保護了個人的隱私,但同時會降低數據的聚類可用性。
因此,在現有的數據發布的隱私保護機制中,主要存在兩方面的問題:一方面是計算復雜、開銷大的問題;另一方面是難以維持數據可用性和隱私性的平衡問題。
發明內容
(一)要解決的技術問題
為了解決現有技術的上述問題,本發明提供一種數據脫敏的方法及裝置,能夠減少計算開銷,并在保證數據的可用性的前提下保護隱私數據。
(二)技術方案
為了達到上述目的,本發明采用的一種主要技術方案包括:
一種數據脫敏的方法,包括步驟:
S1、獲取原始數據,并進行核化處理,得到新的數據;
S2、對所述新的數據進行降維處理,得到降維后的數據;
S3、對所述降維后的數據進行中心化處理,得到脫敏后的數據。
為了達到上述目的,本發明采用的另一種主要技術方案包括:
一種數據脫敏的裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現以下步驟:
S1、獲取原始數據,并進行核化處理,得到新的數據;
S2、對所述新的數據進行降維處理,得到降維后的數據;
S3、對所述降維后的數據進行中心化處理,得到脫敏后的數據。
(三)有益效果
本發明的有益效果在于:通過獲取原始數據,并進行核化處理,得到新的數據;對所述新的數據進行降維處理,得到降維后的數據,不僅去除了數據中的冗余信息,簡化了計算復雜度,減少不必要開銷;對所述降維后的數據進行中心化處理,得到脫敏后的數據,在保證數據的可用性的前提下保護隱私數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒瑞通(福建)信息技術有限公司,未經恒瑞通(福建)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010071239.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





