[發明專利]基于敏感度分層的多敏感屬性隱私保護方法及系統有效
| 申請號: | 202010023028.2 | 申請日: | 2020-01-09 |
| 公開(公告)號: | CN111241581B | 公開(公告)日: | 2022-10-04 |
| 發明(設計)人: | 王有銘;高玲;吳泓辰 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06K9/62 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250358 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 敏感度 分層 敏感 屬性 隱私 保護 方法 系統 | ||
本發明公開了基于敏感度分層的多敏感屬性隱私保護方法及系統,包括:獲取待發布的若干個患者的診療數據,每個患者均對應一條診療數據,每一條診療數據均包括:一個非敏感屬性和若干個敏感屬性;按照非敏感屬性的分層標準,對診療數據進行分成若干層級;根據診療數據之間的相似性,對不同層級之間的診療數據進行聚類;對分類后的每一類診療數據中的所有敏感屬性均進行泛化處理,相同類別的診療數據的泛化處理的程度是一樣的;將泛化處理后的診療數據進行發布。
技術領域
本公開涉及隱私保護技術領域,特別是涉及基于敏感度分層的多敏感屬性隱私保護方法及系統。
背景技術
本部分的陳述僅僅是提到了與本公開相關的背景技術,并不必然構成現有技術。
隨著大數據時代的來臨,研究數據的價值成為科學研究必不可少的一部分,尤其是科研機構對醫院診療大數據的研究也越來越熱門,然而,在醫院數據中心向科研機構發布醫院診療數據時,存在隱私泄露的問題。
近年來,關于隱私保護的研究已經成為一項研究熱點。Samarati和Sweeney在文獻提出了k-匿名模型,它要求發布的數據中存在一定數量(至少為k)的在準標識符上不可區分的記錄,使攻擊者不能判別出隱私信息所屬的具體個體,從而保護了個人隱私,k-匿名通過參數k指定用戶可承受的最大信息泄露風險。k-匿名化在一定程度上保護了個人的隱私,但同時會降低數據的可用性。因此,k-匿名化的研究工作主要集中在保護私有信息的同時提高數據的可用性。l-diversity通過提高等價類中敏感屬性的多樣性,保證了每一個等價類中的敏感屬性至少存在l個不同值來降低隱私泄露?;趉-匿名改進的l-diversity算法很好的解決了同質性攻擊的問題,Machanavajjhala等人提出了l-incognito實現方法。但其過分依賴預先定義的泛化層關系,造成了對于原始數據的過度概化,產生很多不必要的信息損失,導致原數據集的可用性降低,加上背景知識的不確定性,如何設置l-diversity中的參數并沒有好的方法,隱私沒有得到很好的保護?;谌肿R別窮舉算法,與局部識別相比,該算法不可擴展,可能產生更多的失真引用.為解決敏感屬性值偏斜型和相似性攻擊,提出了t-closeness方法,要求每個K元組中敏感屬性值分布與k匿名表的分布差異不超過t,同時提出了一種新穎的距離度量公式EMD,對數據表中分類型和數值型均定義了合理的計算方法,但該方法大大也降低了數據可用性。Aggarwal等人提出了一種基于聚類的匿名方法。該方法首先在滿足匿名模型的前提下對原始數據集進行聚類,然后按照泛化原則對元組進行泛化處理。由于該方法是基于k-匿名模型,在減少信息損失的同時會大大增加隱私泄露的風險。針對以上問題,王智慧等提出了l-clustering算法,方法是將準標識符中的屬性分為有序屬性和無序屬性兩種類型,并針對這兩種屬性給出了更加合理的概化策略.該方法通過將概化后信息損失少的數據聚為一簇,有效降低概化處理的信息損失.但是該算法在數據相似性計算上較為復雜,所以算法的計算復雜度較高,并且在聚類過程中沒有考慮到敏感屬性的問題.
在實現本公開的過程中,發明人發現現有技術中存在以下技術問題:
在醫院數據中心向科研機構發布醫院診療數據時,如果沒有相應的隱私保護策略,醫院數據中心將所有的診療信息全部發送給科研機構,則可能會有患者隱私泄露的風險;如果醫院數據中心對患者隱私數據進行全面剔除,則科研機構得到的數據僅僅是疾病數據,與疾病相關的一些數據將得不到進一步的研究。因此,在醫院診療數據發布前,如何對診療數據進行適度地隱私保護是目前遇到的一項難題。
發明內容
為了解決現有技術的不足,本公開提供了基于敏感度分層的多敏感屬性隱私保護方法及系統;
第一方面,本公開提供了基于敏感度分層的多敏感屬性隱私保護方法;
基于敏感度分層的多敏感屬性隱私保護方法,包括:
獲取待發布的若干個患者的診療數據,每個患者均對應一條診療數據,每一條診療數據均包括:一個非敏感屬性和若干個敏感屬性;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010023028.2/2.html,轉載請聲明來源鉆瓜專利網。





