[發明專利]一種分布式環境下隱私保護的關聯規則挖掘方法和系統有效
| 申請號: | 201810832113.6 | 申請日: | 2018-07-26 |
| 公開(公告)號: | CN108920714B | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 周奕雯;馮家銘;胡煜宗;黃征;薛昊;連慧娟 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/2458 |
| 代理公司: | 上海旭誠知識產權代理有限公司 31220 | 代理人: | 鄭立 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分布式 環境 隱私 保護 關聯 規則 挖掘 方法 系統 | ||
1.一種支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,包括如下步驟:
步驟一,可信機構在執行初期選擇兩個大素數p,α作為安全參數,并將一個共享密鑰s發送所有用戶;
步驟二,所述用戶對數據加密,第i個用戶Ui為第j個事務中的第k個項目itemk選取隨機數rijk,再使用所述共享密鑰s對事務j中的所有項目分別計算eijk=s(α·itemk+rijk)modp,將事務j整合為Ej={eij1,eij2,...,eijti},重復該過程加密Ui的所有事務得到加密后的事務Si={E1,E2,...,Eti},將Si發送給計算集群,其中,ti為第i個用戶Ui的事務總數量;
步驟三,所述計算集群挖掘關聯規則,針對所有所述用戶的事務集{Si}及關聯規則k′為Ix的項目數,k′′為Iy的項目數,Ixy=Ix∩Iy,計算Ixy的支持數以及Ix的支持數將SC’xy,SC′x,N發送給所述用戶,其中N為數據記錄個數;
步驟四,所述用戶計算關聯規則,所述用戶獲得SC’xy,SC′x,N,先計算以及再計算真實的支持數以及最終計算關聯規則的支持度Sup=SCxy/N和置信度Conf=SCxy/SCx 。
2.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,在所述加密過程對每個項目加入一個隨機數項作干擾噪聲,密文符合在群上隨機分布。
3.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,在所述挖掘關聯規則過程中,對同一條事務內頻繁項采用相乘方式,不同條事務的結果相加,避免隨機噪聲累加干擾實際值的計算,計算關聯規則時支持數為除以αk′+k″所得整數部分。
4.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,所述計算集群由Scala分布式計算框架搭建。
5.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,所述可信機構在執行初期初始化整個系統。
6.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,所述用戶在所述可信機構注冊時,所述可信機構會為所述用戶分配標識符。
7.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,所述大素數p參數范圍為2048至4096位。
8.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,所述共享密鑰s參數范圍為2048至4096位。
9.如權利要求1所述的支持分布式環境下隱私保護的關聯規則挖掘方法,其特征在于,所述可信機構、所述用戶和所述計算集群網絡連接。
10.一種支持分布式環境下隱私保護的關聯規則挖掘系統,其特征在于,包括可信機構、用戶和計算集群;所述可信機構初始化整個系統,為所述用戶分發密鑰;所述用戶將需要進行關聯規則挖掘的數據進行加密后,發送給所述計算集群;所述計算集群根據所述用戶發送的關聯規則挖掘需求進行計算和分析,再將結果返回給所述用戶;所述用戶得到返回結果后,利用共享密鑰進行解密從而得到真實的關聯規則;
所述可信機構、所述用戶和所述計算集群,被配置為按照如權利要求1所述的方法工作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810832113.6/1.html,轉載請聲明來源鉆瓜專利網。





