[發(fā)明專(zhuān)利]一種事務(wù)數(shù)據(jù)的本地差分隱私收集方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010014936.5 | 申請(qǐng)日: | 2020-01-07 |
| 公開(kāi)(公告)號(hào): | CN111199057A | 公開(kāi)(公告)日: | 2020-05-26 |
| 發(fā)明(設(shè)計(jì))人: | 歐陽(yáng)佳;肖政宏;劉少鵬 | 申請(qǐng)(專(zhuān)利權(quán))人: | 廣東技術(shù)師范大學(xué) |
| 主分類(lèi)號(hào): | G06F21/62 | 分類(lèi)號(hào): | G06F21/62 |
| 代理公司: | 北京勁創(chuàng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11589 | 代理人: | 陸瀅炎 |
| 地址: | 510665 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 事務(wù) 數(shù)據(jù) 本地 隱私 收集 方法 | ||
本發(fā)明提供一種事務(wù)數(shù)據(jù)的本地差分隱私收集方法,步驟包括:基于不同距離的d與m,隨機(jī)生成事務(wù)數(shù)據(jù)集D;對(duì)D所有的數(shù)據(jù)作等長(zhǎng)處理,使之長(zhǎng)度為m,設(shè)k的范圍為[1,d],可以遍歷所有的k,找到使得項(xiàng)的頻數(shù)分布估計(jì)的錯(cuò)誤邊界最小的k;基于距離函數(shù),從k+1個(gè)候選項(xiàng)集子空間中隨機(jī)抽取一個(gè),得到inter;基于inter生成事務(wù)數(shù)據(jù),并發(fā)送給事務(wù)數(shù)據(jù)收集者,數(shù)據(jù)收集者得到數(shù)據(jù)后,運(yùn)用頻數(shù)估計(jì)算法估計(jì)每個(gè)項(xiàng)的頻數(shù);進(jìn)行TopK頻繁項(xiàng)集挖掘;驗(yàn)證隱私參數(shù)設(shè)置策略,并且與PrivSet進(jìn)行比較與分析。本事務(wù)數(shù)據(jù)的本地差分隱私收集方法可有效保護(hù)用戶(hù)的事務(wù)數(shù)據(jù),保證用戶(hù)隱私不會(huì)泄漏,避免用戶(hù)數(shù)據(jù)流失,造成不必要的損失。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)收集技術(shù)領(lǐng)域,具體來(lái)說(shuō),涉及一種事務(wù)數(shù)據(jù)的本地差分隱私收集方法。
背景技術(shù)
事務(wù)數(shù)據(jù)是項(xiàng)的集合,其中包含豐富的信息并可應(yīng)用于不同的場(chǎng)景(如:購(gòu)買(mǎi)的商品,看過(guò)的電影記錄,搜索日志,網(wǎng)頁(yè)瀏覽歷史等).隨著大數(shù)據(jù)技術(shù)的發(fā)展,海量的事務(wù)數(shù)據(jù)被收集,其中蘊(yùn)含豐富的知識(shí),數(shù)據(jù)收集者通過(guò)數(shù)據(jù)分析(如:協(xié)同過(guò)濾、關(guān)聯(lián)規(guī)則等),基于得到的模型為用戶(hù)提供更好的服務(wù).
然而,事務(wù)數(shù)據(jù)中往往包含個(gè)人隱私信息,如搜索網(wǎng)頁(yè)時(shí)產(chǎn)生的搜索日志會(huì)泄露自己的健康狀態(tài)、居住地點(diǎn)等信息;網(wǎng)上購(gòu)物時(shí)產(chǎn)生的購(gòu)物記錄將泄露自己所購(gòu)買(mǎi)的隱私物品,甚至?xí)孤蹲约旱馁?gòu)物習(xí)慣以及行為模式;瀏覽網(wǎng)頁(yè)時(shí)產(chǎn)生的WEB點(diǎn)擊流將泄露自己的上網(wǎng)習(xí)慣等等.如果不采取任何保護(hù)措施直接收集并分析用戶(hù)的數(shù)據(jù),將會(huì)導(dǎo)致個(gè)人隱私信息的泄露,造成嚴(yán)重危害.震驚世界的AOL日志隱私泄露事件已敲響警鐘,因隱私泄露所帶來(lái)的困擾將嚴(yán)重影響著人們的合法權(quán)益和生活質(zhì)量.
目前,事務(wù)數(shù)據(jù)隱私保護(hù)發(fā)布是研究熱點(diǎn),大多數(shù)研究是將真實(shí)完整的事務(wù)數(shù)據(jù)發(fā)送到數(shù)據(jù)中心,并假設(shè)數(shù)據(jù)中心或數(shù)據(jù)收集者是可信的.數(shù)據(jù)收集者對(duì)數(shù)據(jù)進(jìn)行擾亂處理后,發(fā)布滿足差分隱私約束的數(shù)據(jù)集或相關(guān)統(tǒng)計(jì)信息,該方法統(tǒng)稱(chēng)為中心化差分隱私技術(shù).但盡管數(shù)據(jù)收集者宣稱(chēng)不會(huì)泄露或竊取用戶(hù)的敏感信息,但在商業(yè)或利益的驅(qū)使下,用戶(hù)隱私很難得到保證,因此假設(shè)數(shù)據(jù)中心或數(shù)據(jù)收集者是可信的這一點(diǎn)是不切實(shí)際的。
針對(duì)相關(guān)技術(shù)中的問(wèn)題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種事務(wù)數(shù)據(jù)的本地差分隱私收集方法,以解決上述背景技術(shù)中提出的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種事務(wù)數(shù)據(jù)的本地差分隱私收集方法,步驟包括:
a1.基于不同的d與m,隨機(jī)生成事務(wù)數(shù)據(jù)集D;
a2.對(duì)D所有的數(shù)據(jù)作等長(zhǎng)處理,使之長(zhǎng)度為m,;
a3.設(shè)k的范圍為[1,d],可以遍歷所有的k,找到使得項(xiàng)的頻數(shù)分布估計(jì)的錯(cuò)誤邊界最小的k;
a4.基于距離函數(shù),從k+1個(gè)候選項(xiàng)集子空間中隨機(jī)抽取一個(gè),得到inter;
a5:基于inter生成事務(wù)數(shù)據(jù),并發(fā)送給事務(wù)數(shù)據(jù)收集者。
進(jìn)一步地,距離函數(shù)是:
dist(t,s)=|t∩s|
令t表示用戶(hù)擁有的事務(wù)數(shù)據(jù),基于隱私模型隨機(jī)抽取一個(gè)候選項(xiàng)集s,dist為候選項(xiàng)集s與t的交集的長(zhǎng)度。
進(jìn)一步地,項(xiàng)的頻數(shù)分布估計(jì)的錯(cuò)誤邊界包含項(xiàng)分布估計(jì)的均方差MSE,所述MSE的計(jì)算如下:
Fa的方差為:
Var(Fa)=n·Pa·TPR·(1-TPR)+(n-n·Pa)·FPR·(1-FPR)
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于廣東技術(shù)師范大學(xué),未經(jīng)廣東技術(shù)師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010014936.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤(pán)或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 一種事務(wù)處理的方法和裝置
- 分布式事務(wù)處理方法與系統(tǒng)
- 一種融合原生事務(wù)和邏輯事務(wù)的方法
- 用于聚結(jié)內(nèi)存事務(wù)的方法和系統(tǒng)
- 事務(wù)處理方法、事務(wù)參與節(jié)點(diǎn)及事務(wù)協(xié)調(diào)節(jié)點(diǎn)
- 跨進(jìn)程分布式事務(wù)控制方法及相關(guān)系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 一種分布式事務(wù)處理的智能監(jiān)控方法及服務(wù)器
- 分布式事務(wù)處理方法及裝置
- 讀寫(xiě)事務(wù)控制方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種授權(quán)管理系統(tǒng)和方法及授權(quán)管理服務(wù)器
- 一種授權(quán)管理系統(tǒng)和方法及授權(quán)管理服務(wù)器
- 用于生成隱私簡(jiǎn)檔的方法和設(shè)備
- 手機(jī)隱私保護(hù)系統(tǒng)
- 密碼設(shè)置方法及裝置
- 移動(dòng)終端和移動(dòng)終端的隱私保護(hù)方法
- 一種隱私信息保護(hù)方法、裝置及系統(tǒng)
- 一種隱私信息管理方法、裝置和系統(tǒng)
- 圖片隱私的預(yù)測(cè)方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種基于區(qū)塊鏈的隱私安全管理系統(tǒng)





