[發明專利]高維敏感數據隱私分級保護發布方法、系統、介質及設備有效
| 申請號: | 202110446261.6 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN113254988B | 公開(公告)日: | 2022-10-14 |
| 發明(設計)人: | 趙興文;洪意陽;李暉;朱輝;寇笑語 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F17/16 |
| 代理公司: | 西安長和專利代理有限公司 61227 | 代理人: | 何畏 |
| 地址: | 710071 陜西省西安市長安區*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 敏感數據 隱私 分級 保護 發布 方法 系統 介質 設備 | ||
本發明屬于信息安全數據發布技術領域,公開了一種高維敏感數據隱私分級保護發布方法、系統、介質及設備,所述高維敏感數據隱私分級保護發布方法包括:發布方進行數據采集,選擇總隱私保護參數ε;發布方數據采集完畢后,進行數據預處理;數據發布方評估數據屬性的隱私保護等級;發布方進行數據隱私噪聲擾動;利用稀疏矩陣變換方法得到k維的低維矩陣;將低維矩陣復原,進而恢復均值化之前的矩陣;形成隱私保護加噪的m行n列矩陣和數據表,并形成對外發布隱私版本的數據。本發明在兼顧海量高維敏感數據集各個屬性的隱私保護程度需求不同的情況下,大幅提升海量高維敏感數據隱私保護發布的運行效率;在相同隱私保護程度下,提升數據的可用性。
技術領域
本發明屬于信息安全數據發布技術領域,尤其涉及一種高維敏感數據隱私分級保護發布方法、系統、介質及設備。
背景技術
目前,隨著大數據云計算的時代到來,信息時代隨時都充滿著各式各樣的高維數據。而對于醫療、民生、財政、公安等領域相關的權威部門經常需要發布一些數據以提供給第三方進行分析統計。然而,上述權威部門所發布的信息往往包含極其敏感的數據,若直接發布原始信息,則個體樣本的敏感數據很有可能被第三方利用。當攻擊者具有強大的背景知識且具有非法的意圖時,這些敏感信息的泄露將會造成無法預估的后果。
而數據發布是信息公開的重要方式,因此確保敏感數據發布的信息安全是一項重要的措施。傳統的敏感數據數據發布可采用經典的拉普拉斯算法直接添加噪音擾動,使得在保證統計結果相對近似的情況下,無法泄露個體樣本的信息。然而,醫療、民生、財政、公安等領域需要發布的數據往往都是維度較高且樣本較多。若采用傳統的拉普拉斯機制加噪擾動方法,則因為數據量過大而導致噪音過多,從而導致數據的失真度較大,這樣發布則導致數據的可用性較差,降低權威部門數據發布的公信力。同時,在一些需要發布的龐大數據集中往往有著很多不同敏感等級需求的數據,其中有一部分屬性需要較強的保密性,即使以犧牲一定的可用性作為代價;但是還有一部分屬性并不需要嚴格保密,這部分屬性應當仍以盡可能保證可用性和減少誤差率為原則。因此,根據不同屬性各自的隱私保護需求制定不同的隱私保護方案具有較為實用的意義。
通過上述分析,現有技術存在的問題及缺陷為:
(1)傳統的隱私保護機制通常為拉普拉斯加擾機制,該機制當面對海量高維度數據時,會引入過量噪聲,如何控制數據失真度的問題亟待解決。
(2)傳統的針對海量高維度數據隱私保護算法在現有的硬件資源中運算處理速度往往較慢,如何在有限的硬件資源下提高海量高維數據的隱私保護算法運算處理效率等問題也需要解決。
(3)傳統的針對數據集的隱私保護方法并未考慮到不同屬性所需的隱私保護程度需求不同,因此在兼顧不同屬性之間隱私保護程度的差異性上還具有一些提升空間。
(4)目前現有針對海量高維數據的隱私保護的方法往往都是先將原始數據矩陣轉化為低維投影矩陣,然后在投影矩陣上加入擾動噪聲,進而恢復與原數據矩陣規模相同的隱私保護版本的數據矩陣。然而,這種方法大多屬于在計算投影矩陣之后加入噪聲擾動,這種方案在隱私保護和可用性的平衡上,還存在較大的提升空間。
解決以上問題及缺陷的難度為:設計一種方案需要既兼顧數據集內不同屬性的隱私性與可用性的平衡,又對海量高維敏感數據集整體隱私保護發布的運行效率有所提升。
解決以上問題及缺陷的意義為:本發明在兼顧海量高維敏感數據集各個屬性的隱私保護程度需求不同的情況下,大幅提升海量高維敏感數據隱私保護發布的運行效率。同時,與傳統隱私保護處理方法相比,在相同隱私保護程度下,提升數據的可用性。
發明內容
針對現有技術存在的問題,本發明提供了一種高維敏感數據隱私分級保護發布方法、系統、介質及設備,尤其涉及一種基于分塊稀疏矩陣變換的高維敏感數據隱私分級保護發布方法、系統、介質及設備。
本發明是這樣實現的,一種高維敏感數據隱私分級保護發布方法,所述高維敏感數據隱私分級保護發布方法包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110446261.6/2.html,轉載請聲明來源鉆瓜專利網。





