[發明專利]一種面向云計算的多關鍵字可排序密文檢索方法有效

申請號：	201711247475.0	申請日：	2017-12-01
公開（公告）號：	CN108171071B	公開（公告）日：	2020-02-07
發明（設計）人：	許建;黃新宇;楊庚;陳燕俐;陳蕾;朱玉昊	申請（專利權）人：	吉林省外國企業服務有限公司
主分類號：	G06F21/62	分類號：	G06F21/62;G06F16/22;G06F16/2455
代理公司：	11543 北京八月瓜知識產權代理有限公司	代理人：	李斌
地址：	130021 吉林省長***	國省代碼：	吉林;22
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	排序檢索效率密文檢索云計算構建上傳文檔檢索集合分組查詢后續節點檢索結果文檔向量效率差異成正比分組法結構樹結果集樹節點樹結構索引樹文檔集陷門算法索引加密判定返回改進
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種面向云計算的多關鍵字可排序密文檢索方法，通過分組法對文檔關鍵字集進行分組，對每組逆關鍵字集文檔向量集合構建相應的B⁺索引樹，采用基于改進的KNN查詢算法進行加密后上傳至云，并在上傳查詢陷門后通過TF?IDF模型對檢索結果集合進行排序，返回給用戶相關性分數最高的前k個文檔。本發明的特點在于相對于其他結構樹而言B⁺樹的高度要低一些，由于檢索效率和高度成正比增加，這種效率差異會隨著文檔集和關鍵字集的增加而愈發明顯，采用分組構建B⁺樹結構索引的方法可以大大提高檢索速度。并且通過相關性分數比較，在結果集滿足需求數量的前提下，提前判定是否繼續檢索當前樹節點的后續節點，從而對檢索效率進行進一步的提升。

技術領域

本發明涉及計算機應用技術領域，特別是一種面向云計算的多關鍵字可排序密文檢索方法。

背景技術

隨著云計算的發展與普及，為了減少本地存儲和使用方便，更多的個人或公司會把數據上傳至云服務中去，以達到隨時隨地可以操作其數據的目的。但是云服務給用戶帶來極大便利的同時，由于用戶將數據上傳到不受信任的第三方，會帶來極大的數據隱私泄露的安全隱患。

針對這一問題，許多用戶會在上傳之前對其數據進行加密以避免數據遭到非法使用，但是這種做法導致基于明文的許多方法不在適用，使數據更加難以操作。目前國內外很多學者對密文檢索這一方法進行研究，并獲得了很大進展。由于對數據加密后導致數據結構更加復雜，目前在索引大小和檢索效率上，密文檢索還不能與明文檢索相比。

發明內容

本發明所要解決的技術問題是克服現有技術的不足而提供一種面向云計算的多關鍵字可排序密文檢索方法，該方法可以降低索引內存，并有效提高檢索效率。

本發明為解決上述技術問題采用以下技術方案：

根據本發明提出的一種面向云計算的多關鍵字可排序密文檢索方法，包括以下步驟：

步驟1、根據數據集構建分組索引數據；

步驟2、利用B⁺樹對步驟1中的每組數據進行索引構建并加密，并和加密后的文檔集一起上傳到云服務器中；

步驟3、根據用戶輸入的查詢關鍵字，創建對應的查詢向量后，對查詢向量進行加密后形成陷門，將陷門上傳至云服務器；

步驟4、在云服務器中利用步驟3中的陷門在步驟2中的索引進行查詢計算，返回給用戶相關性最高的前k個加密文檔。

作為本發明所述的一種面向云計算的多關鍵字可排序密文檢索方法進一步優化方案，

所述步驟1具體步驟如下：

步驟1-1：根據數據集構建明文文檔向量集F，并提取關鍵字集W，其中W＝{w₁，w₂，…，w_n}，n為關鍵字集大小，w_j表示第j個關鍵字，j＝1，2，…n；F＝{f₁，f₂，…，f_m}，m為數據集數量，f_i為數據集中第i個文檔對應的文檔向量，f_i的長度和W的長度一致，存儲的為關鍵字集W中的關鍵字在f_i所代表的文檔中的詞頻TF值，如果關鍵字沒有出現在f_i所代表的文檔中，則f_i中與該關鍵字所對應的位置存儲0；其中，i＝1，2，…m；

步驟1-2：根據W創建逆關鍵字文檔向量集O，其中O＝{op(w₁)，op(w₂)，…，op(w_n)}，op(w_j)表示包含w_j的TF值最高的前c×k個文檔向量集，c是正整數；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于吉林省外國企業服務有限公司，未經吉林省外國企業服務有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201711247475.0/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種數據處理方法、裝置及計算機設備
下一篇：一種保護隱私的方法及移動終端

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理
G06F21-00 防止未授權行為的保護計算機或計算機系統的安全裝置
G06F21-02 .通過保護計算機的特定內部部件
G06F21-04 .通過保護特定的外圍設備，如鍵盤或顯示器
G06F21-06 .通過感知越權操作或外圍侵擾
G06F21-20 .通過限制訪問計算機系統或計算機網絡中的節點
G06F21-22 .通過限制訪問或處理程序或過程

免登錄下載普通用戶下載升級VIP會員，免費下載

[發明專利]一種面向云計算的多關鍵字可排序密文檢索方法有效

專利文獻下載