[發明專利]基于稀疏數據集的隱私保護關聯規則挖掘方法有效
| 申請號: | 202110295010.2 | 申請日: | 2021-03-19 |
| 公開(公告)號: | CN112966281B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 王保倉;閔玉瑋;段普;張本宇;胡予濮 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F21/62;G06F16/2458;H04L9/00 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 侯瓊;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 稀疏 數據 隱私 保護 關聯 規則 挖掘 方法 | ||
1.一種基于稀疏數據集的隱私保護關聯規則挖掘方法,其特征在于,包括如下步驟:
(1)系統初始化:
(1.1)密鑰生成中心根據分布式雙陷門密碼DT-PKC生成系統參數,其中包括整數N以及強私鑰SK;
(1.2)密鑰生成中心根據系統參數為每一個數據擁有者DOi生成擁有者密鑰對為數據挖掘者生成挖掘者密鑰對(pkM,skM)、為系統生成一個中間轉換公鑰pkT,將強私鑰SK拆分為第一強私鑰SK1和第二強私鑰SK2兩個部分,并分別發送給第一云服務器CA和第二云服務器CB;其中i=1,2...n表示數據擁有者的編號,n表示數據擁有者的總個數;
(2)數據擁有者使用各自的公鑰逐比特加密二進制交易數據,得到包含m條加密交易的數據集T={T1,T2,…,Tj,…,Tm},并將其發送至第一云服務器CA;其中h表示每條交易的項目總數;
(3)數據挖掘者加密查詢相關信息并上傳至CA:
(3.1)數據挖掘者根據本地數據集選擇查詢項集Q′=(q1,…,qh);并設定參與計算的項目分組總數的上限l2、下限l1及每個分組中的項目個數w;
(3.2)根據查詢項集Q′=(q1,…,qh),按照下式計算:
bσ=qw(σ-1)+1∨qw(σ-1)+2∨…∨qmin(h,wσ),
得到查詢分組標記集合
(3.3)遍歷查詢分組標記集合B'中的所有元素,統計其中“1”的數目,記為temp;并將“0”對應的元素下標σ添加到集合I中;
(3.4)對temp進行如下判斷:若temp≥l2,則直接執行步驟(3.5);若temp<l2,選擇一個隨機數χ∈[f(l1-temp),l2-temp],其中函數f定義為然后從集合I中隨機選取χ個數,并將其在B'中對應的元素替換為1,得到更新后查詢分組標記集合B;
(3.5)數據挖掘者選定置信度閾值confmin=ε1/ε2并加密得到密文和對查詢項集Q'加密得到查詢項集密文集合統計查詢項目個數c并加密得到密文選定支持度閾值suppmin并加密得到密文
(3.6)將得到的所有密文與B一起發送給第一云服務器CA;
(4)第一云服務器CA在第二云服務器CB的輔助下計算查詢項集與每一條交易的內積密文,獲取數據集T的內積密文集合,具體按如下步驟實現:
(4.1)判斷bσ是否為1,若是,則Tj中對應的交易分組(Tj,w(σ-1)+1,…,Tj,min(h,wσ))需要參與挖掘,否則,對應項目分組不需要參與挖掘;Tj中第υ個參與挖掘的交易分組記作其中υ∈(1,…,η),η表示B中存在“1”的個數,kυ是B中第υ個“1”的對應下標值;
(4.2)第一云服務器CA和第二云服務器CB以交易分組Gj,υ與查詢Q中對應查詢分組為輸入,執行安全內積計算協議得到對所有交易分組與查詢對應分組執行安全內積計算協議得到Tj的分組內積密文集合
(4.3)第一云服務器CA根據Dj計算Tj的內積密文得到數據集T的內積密文集合E=(e1,…,ej,…,em);
(5)第一云服務器CA在第二云服務器CB的輔助下,計算得到查詢項集Q'的支持度密文
(5.1)第一云服務器CA選取一個隨機數計算c盲化后的密文然后使用第一強私鑰SK1部分解密得到A的一級解密結果并將{A,A'}發送至第二云服務器CB;
(5.2)第二云服務器CB使用第二強私鑰SK2解密得到A的明文并使用公鑰pkT加密后獲得轉換密鑰后的密文將其發送給第一云服務器CA;
(5.3)第一云服務器CA根據密文得到公鑰pkT加密c的密文結果再選取一個隨機數|N|表示N的二進制位數;對E中的每個元素,云服務器CA選取兩個隨機數滿足rj,2<<ra,計算用以更新ej,并使用SK1對其進行部分解密得到ej';將ej'添加到集合E'中,然后將{E,E'}發送至第二云服務器CB;
(5.4)設定一個集合第二云服務器CB使用SK2進行解密,得到ej”并判斷如下:如果ej”<N/2,則令否則令然后將vj加入集合V中;并將V發送給第一云服務器CA;
(5.5)第一云服務器CA初始化變量判斷是否滿足rj,1=1,如果是則更新否則vj不變;
(5.6)令R=R·vj,得到查詢項集Q的支持度密文
(6)第一云服務器CA在第二云服務器CB的輔助下比較和對應的明文大小,得到挖掘結果并發送給數據挖掘者:
(6.1)第一云服務器CA選取兩個隨機數滿足r2<<r1,l<|N|/2-1,再選取一個隨機數以和為輸入運行安全加法計算協議得到A1,再對A1進行盲化后得到然后第一云服務器CA使用SK1對B1進行部分解密得到解密結果將{B1,B1′}發送給云服務器CB;
(6.2)第二云服務器CB使用SK2解密得到B1的明文如果B″1<N/2,則令否則令發送t至第一云服務器CA;
(6.3)第一云服務器CA進行判斷,如果r3=0,則令否則然后將挖掘結果發送給數據挖掘者;
(7)數據挖掘者使用自己的私鑰解密挖掘結果得到解密結果s并判斷:如果s=1,則查詢項集是頻繁項集,如果s=0,則查詢項集是非頻繁項集;
(8)數據挖掘者計算出頻繁項集的非空真子集得到Z′的分組標記集合以及查詢項目總數集合對Z′和P'加密后與ψ一同發給第一云服務器CA;
(8.1)數據挖掘者通過不斷選定可能頻繁的查詢項集向兩個云服務器發起詢問判斷所選查詢是否是頻繁項集,最終找到的頻繁項集記作f'=(f1',…,fh'),根據f'生成其非空真子集Z′作為新的查詢集合;
(8.2)數據挖掘者計算出非空真子集Z′的查詢分組計算標記集合ψ,對Z′中每一個項集加密獲得其中再統計Z′中每一個項集中存在的項目總個數并加密得到集合將以上加密數據Z和P發送給第一云服務器CA;
(9)第一云服服務器CA在第二云服務器CB的輔助下基于密文比較Z′中每一個項集的置信度與置信度閾值的大小,將比較結果發送給數據挖掘者;
(10)數據挖掘者使用自己的私鑰解密比較結果U,并判斷:如果uθ=1,則是強關聯規則,如果uθ=0,則不是強關聯規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110295010.2/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





