[發(fā)明專利]面向混合云的隱私保護(hù)多關(guān)鍵詞Top-k密文檢索方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810122376.8 | 申請日: | 2018-02-07 |
| 公開(公告)號: | CN108363689B | 公開(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 戴華;朱向洋;楊庚;白雙杰;史經(jīng)啟;孫彥珺;王敏 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/33;G06K9/62;H04L29/06;H04L29/08 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 馮艷芬 |
| 地址: | 210003 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 混合 隱私 保護(hù) 關(guān)鍵詞 top 檢索 方法 系統(tǒng) | ||
1.一種面向混合云的隱私保護(hù)多關(guān)鍵詞Top-k密文檢索方法,其特征在于該方法包括:
(1)數(shù)據(jù)提供端從提供的文檔集中提取關(guān)鍵詞集合,并通過聚簇分塊生成關(guān)鍵詞詞典序列;再根據(jù)關(guān)鍵詞詞典序列為文檔集中每個(gè)文檔生成一對應(yīng)的明文文檔向量,并依據(jù)關(guān)鍵詞詞典序列的分塊情況將明文文檔向量分塊,形成文檔過濾向量;之后將明文文檔向量加密形成加密文檔向量,將文檔集中的每一文檔加密形成加密文檔集;最后將文檔過濾向量傳輸至私有云服務(wù)器,將加密文檔向量和加密文檔集傳輸至公有云服務(wù)器;
(2)數(shù)據(jù)檢索端根據(jù)用戶提供的多個(gè)關(guān)鍵詞生成檢索向量,進(jìn)行歸一化后采用安全算法生成檢索陷門,連同用戶需要檢索的文檔個(gè)數(shù)k傳輸至公有云服務(wù)器;再依據(jù)關(guān)鍵詞詞典序列中關(guān)鍵詞的分塊情況,將用戶提供的多個(gè)關(guān)鍵詞生成檢索過濾向量,并傳輸至私有云服務(wù)器;
(3)私有云服務(wù)器將接收到的檢索過濾向量和每個(gè)文檔的文檔過濾向量分別進(jìn)行與運(yùn)算,若運(yùn)算得到的向量所有位不全為0,則將對應(yīng)的文檔編號添加到候選文檔集中,并將候選文檔集傳輸至公有云服務(wù)器;
(4)公有云服務(wù)器根據(jù)接收到的候選文檔集、檢索陷門和檢索文檔個(gè)數(shù)k,分別計(jì)算候選文檔集中每個(gè)文檔對應(yīng)的加密文檔向量和檢索陷門之間的安全內(nèi)積,根據(jù)安全內(nèi)積選取候選文檔集中與用戶提供的關(guān)鍵詞最相關(guān)的k個(gè)密文文檔,將該k個(gè)密文文檔返回至數(shù)據(jù)檢索端;
(5)數(shù)據(jù)檢索端對接收的k個(gè)密文文檔進(jìn)行解密,得到最相關(guān)的k個(gè)明文文檔。
2.根據(jù)權(quán)利要求1所述的面向混合云的隱私保護(hù)多關(guān)鍵詞Top-k密文檢索方法,其特征在于:步驟(1)具體包括:
(1-1)數(shù)據(jù)提供端從提供的文檔集DS中提取關(guān)鍵詞,得到關(guān)鍵詞集合{w1,w2,…,wn},n為關(guān)鍵詞數(shù)目;
(1-2)將關(guān)鍵詞集合中的關(guān)鍵詞根據(jù)相關(guān)關(guān)系進(jìn)行聚簇操作,得到若干個(gè)聚類子簇{c1,c2,…,ct};
(1-3)將每個(gè)子簇作為一個(gè)分塊,從而得到t個(gè)分塊,分別為b1,b2,…,bt,再根據(jù)分塊生成關(guān)鍵詞詞典序列W={w(b1,1),w(b1,2),…,w(b2,1),w(b2,2),…,w(bt,1),w(bt,2),…},其中w(bj,x)表示屬于分塊bj中的第x個(gè)關(guān)鍵詞,每個(gè)塊中的關(guān)鍵詞無序;分塊bj={w(bj,x)|0x≤|bj|};
(1-4)采用TF-IDF算法和空間向量模型,根據(jù)關(guān)鍵詞詞典序列中關(guān)鍵詞的位置,為文檔集DS={D1,D2,…,Dm}中每個(gè)文檔Di生成一個(gè)對應(yīng)的明文文檔向量Vi,并進(jìn)行歸一化處理;其中,m為文檔集DS中的文檔數(shù)目,Vi的維度為n,每位取值為該位對應(yīng)的關(guān)鍵詞在文檔Di中的詞頻TF值;
(1-5)根據(jù)關(guān)鍵詞詞典序列的分塊情況,將明文文檔向量Vi分成t個(gè)分塊,分塊邊界和關(guān)鍵詞詞典序列的分塊邊界相同,得到每個(gè)文檔Di的文檔過濾向量DFi={b1,b2,…,bt};其中,若Vi中分塊bj對應(yīng)的所有關(guān)鍵詞所在的位置取值都為0,則bj塊的取值為0,否則bj塊的取值為1,DFi是t維的每位取值為0/1的向量;
(1-6)生成加密密鑰SK(S,M1,M2,kf);其中,S是一個(gè)每位取值為0/1的隨機(jī)向量,M1和M2是兩個(gè)n×n可逆矩陣,n是關(guān)鍵詞詞典序列的長度,kf是文檔加密密鑰;
(1-7)通過安全KNN技術(shù)采用生成的加密密鑰對每個(gè)明文文檔向量Vi加密,得到對應(yīng)的加密文檔向量其中,當(dāng)隨機(jī)向量S中第j個(gè)元素S[j]=0時(shí),Vi′+Vi″=Vi,當(dāng)S[j]=1時(shí),Vi′=Vi″=Vi;
(1-8)通過對稱加密算法加密文檔集DS中每個(gè)文檔,得到加密文檔集ES={e1,e2,…,em};
(1-9)將文檔過濾向量傳輸至私有云服務(wù)器進(jìn)行存儲,將加密文檔向量和加密文檔集傳輸至公有云服務(wù)器進(jìn)行存儲。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810122376.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





