[發(fā)明專利]一種關聯(lián)大數(shù)據(jù)的隱私保護方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810615122.X | 申請日: | 2018-06-14 |
| 公開(公告)號: | CN108959958A | 公開(公告)日: | 2018-12-07 |
| 發(fā)明(設計)人: | 朱詩兵;呂登龍;李長青;劉冉 | 申請(專利權)人: | 中國人民解放軍戰(zhàn)略支援部隊航天工程大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 李莎 |
| 地址: | 101416*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 隱私保護 獨立數(shù)據(jù)塊 大數(shù)據(jù) 查詢函數(shù) 模型構建模塊 記錄 敏感度 構建 隱私保護模塊 劃分模塊 機器學習 聚類算法 線性回歸 隱私 關聯(lián) | ||
本發(fā)明公開了一種大數(shù)據(jù)的隱私保護方法,包括:通過機器學習構建k?means聚類算法的k相關記錄差分隱私保護模型;通過隱私機制和查詢函數(shù)構建線性回歸r?相關塊差分隱私保護模型;根據(jù)r?相關塊差分隱私保護模型將大數(shù)據(jù)劃分為獨立數(shù)據(jù)塊;根據(jù)查詢函數(shù)計算獨立數(shù)據(jù)塊的敏感度,根據(jù)k?相關記錄差分隱私保護模型對獨立數(shù)據(jù)塊進行差分隱私保護。本發(fā)明還公開了一種大數(shù)據(jù)隱私保護方法的系統(tǒng),包括:k相關記錄差分隱私保護模型構建模塊;r?相關塊差分隱私保護模型構建模塊;獨立數(shù)據(jù)塊劃分模塊;獨立數(shù)據(jù)塊差分隱私保護模塊,用于根據(jù)查詢函數(shù)計算獨立數(shù)據(jù)塊的敏感度,根據(jù)k?相關記錄差分隱私保護模型對獨立數(shù)據(jù)塊進行差分隱私保護。
技術領域
本發(fā)明涉及大數(shù)據(jù)技術領域,特別是指一種關聯(lián)大數(shù)據(jù)的隱私保護方法及系統(tǒng)。
背景技術
大數(shù)據(jù)是信息技術發(fā)展的又一里程碑,被稱為科學研究的“第四范式”,具備科學的理論基礎和先進的技術手段,從提出之日起就引領時代發(fā)展。經(jīng)過幾年的快速發(fā)展,大數(shù)據(jù)被廣泛應用在科技、金融、交通、教育、醫(yī)療衛(wèi)生等各個領域,為推動經(jīng)濟發(fā)展和服務人類社會發(fā)揮了巨大作用創(chuàng)造了巨大價值。
隨著大數(shù)據(jù)技術的發(fā)展和廣泛應用,數(shù)據(jù)采集和數(shù)據(jù)挖掘已成為普遍現(xiàn)象,一方面,通過挖掘隱藏在數(shù)據(jù)背后的潛在價值有利于促進社會發(fā)展,另一方面,過度的數(shù)據(jù)挖掘和缺乏有效的數(shù)據(jù)保護,也導致了數(shù)據(jù)擁有者大量隱私或敏感數(shù)據(jù)泄露的問題。如何在不影響大數(shù)據(jù)分析研究、共享使用的前提下,使得數(shù)據(jù)和隱私安全能夠得到有效保護,成為目前亟待研究和解決的熱點問題。
差分隱私保護具有完備的數(shù)學理論基礎,能夠提供強健的隱私保護,被認為是目前最先進的隱私保護技術。但是在實際應用中,特別是在大數(shù)據(jù)應用場景中,大量數(shù)據(jù)之間往往存在著較強的耦合性或相關性,稱這些數(shù)據(jù)為相關數(shù)據(jù)。現(xiàn)有的差分隱私保護方法在數(shù)據(jù)集上會使攻擊者得到更多的背景知識,增加了隱私泄露的風險。因此,如何利用差分隱私方法解決相關數(shù)據(jù)的隱私保護問題,對研究和解決關聯(lián)大數(shù)據(jù)隱私安全問題具有重要的現(xiàn)實意義。
發(fā)明內容
有鑒于此,本發(fā)明的目的在于提出一種關聯(lián)大數(shù)據(jù)的隱私保護方法及系統(tǒng),以更好地保護大數(shù)據(jù)的隱私安全。
基于上述目的本發(fā)明提供的一種關聯(lián)大數(shù)據(jù)的隱私保護方法,包括:
通過機器學習和最大信息系數(shù)構建關聯(lián)大數(shù)據(jù)的因果關系模型;
通過k-相鄰數(shù)據(jù)集構建k-相關記錄差分隱私保護模型;
提供相關敏感度概念,通過所述因果關系模型計算所述k-相鄰數(shù)據(jù)集的相關敏感度,再利用means-Laplace機制實現(xiàn)k-相關記錄差分隱私保護;
利用最大信息系數(shù)-K-Means算法將所述關聯(lián)大數(shù)據(jù)進行r-塊劃分,得到多個相互獨立的數(shù)據(jù)子塊;
根據(jù)查詢函數(shù)計算所述數(shù)據(jù)子塊的相關敏感度,對每個數(shù)據(jù)子塊進行所述k-相關記錄差分隱私保護;
根據(jù)差分隱私組合性質,對所述關聯(lián)大數(shù)據(jù)集進行r-相關塊差分隱私的保護。
在其中一個實施例中,所述k-相關記錄差分隱私保護模型包括:
其中,D1為大數(shù)據(jù)集,D2為大數(shù)據(jù)集D1中k條記錄發(fā)生改變所生成,1≤k≤l,l為大數(shù)據(jù)集D1中的記錄條數(shù),為隱私機制,f為查詢函數(shù),Pr為概率分布,為實數(shù)集,∈為隱私預算。
在其中一個實施例中,所述隱私機制滿足f為查詢函數(shù),e為隨機噪聲,‖·‖1為1范數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍戰(zhàn)略支援部隊航天工程大學,未經(jīng)中國人民解放軍戰(zhàn)略支援部隊航天工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810615122.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 基于大數(shù)據(jù)平臺的網(wǎng)絡安全實施系統(tǒng)及方法
- 基于事件驅動的智慧城市大數(shù)據(jù)體系及處理方法
- 一種大數(shù)據(jù)應用開發(fā)的系統(tǒng)及方法
- 家用設備報告的生成方法、大數(shù)據(jù)系統(tǒng)和存儲介質
- 一種基于計算機大數(shù)據(jù)的平臺架構
- 一種大數(shù)據(jù)處理系統(tǒng)
- 面向工業(yè)4.0的時空大數(shù)據(jù)分布式存儲檢索方法及系統(tǒng)
- 一種聯(lián)網(wǎng)式醫(yī)療大數(shù)據(jù)分級傳輸方法及系統(tǒng)
- 一種大數(shù)據(jù)信息監(jiān)控方法、裝置及計算機設備
- 一種知識產(chǎn)權大數(shù)據(jù)情報檢索系統(tǒng)





