[發明專利]一種語義理解的密文空間關鍵字檢索方法及系統在審
| 申請號: | 202011135390.5 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112257455A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 馬建峰;李佳憶;苗銀賓;楊帆;李穎瑩;馬卓然 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/31;G06F16/33;G06F21/60;G06F21/62 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 陳翠蘭 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語義 理解 空間 關鍵字 檢索 方法 系統 | ||
1.一種語義理解的密文空間關鍵字檢索方法,其特征在于,包括以下步驟:
步驟1、生成AES密鑰,以及可搜索加密算法密鑰;
步驟2、提取空間對象文本描述的文本-主題概率分布向量,以及每個詞語在主題上的詞語-主題概率分布向量,根據文本-主題概率分布向量確定出文本集-主題概率分布向量,根據文本-主題概率分布向量和詞語-主題概率分布向量確定詞語在文本集上的詞語-文本集概率分布向量;
步驟3、根據空間對象的文本-主題概率分布向量和對應空間位置坐標,給每個空間對象構建明文索引,并對明文索引進行加密,形成密文索引;
步驟4、根據步驟2中得到的文本集-主題概率分布向量、詞語-主題概率分布向量以及詞語-文本集概率分布向量,提取查詢語句中關鍵字的查詢-主題概率分布向量,將數據使用者的空間位置坐標與查詢-主題概率分布向量結合生成查詢向量,采用可搜索加密算法密鑰對查詢向量進行加密,得到查詢陷門;
步驟5、根據查詢陷門和密文索引確定空間對象與查詢語句之間的混合相似度并排序,將排序靠前的k個密文索引對應的空間對象的加密數據發送給數據使用者,數據使用者利用AES密鑰對其解密。
2.根據權利要求1所述的一種語義理解的密文空間關鍵字檢索方法,其特征在于,步驟2利用自然語言處理模型提取每個空間對象的文本描述在各個主題上的文本-主題概率分布向量VD,以及每個詞語在各個主題上的詞語-主題概率分布向量VK。
3.根據權利要求1所述的一種語義理解的密文空間關鍵字檢索方法,其特征在于,步驟2中確定詞語-文本集概率分布向量的方法如下:
數據擁有者將所有對象文本描述的文本-主題概率分布向量VD相加并除以對象個數,獲取反映各個主題在文本集出現的文本集-主題概率分布向量Pt;
數據擁有者根據文本集-主題概率分布向量Pt以及每個詞語的詞語-主題概率分布向量VK,計算各個詞語在文本集中出現的詞語-文本集概率分布向量Pω。
4.根據權利要求1所述的一種語義理解的密文空間關鍵字檢索方法,其特征在于,步驟3中構建密文索引的方法如下:
將空間對象位置坐標添加在文本-主題概率分布向量后面并進行合并形成明文索引Di,對明文索引的維度進行擴充,采用可搜索加密算法密鑰SK對擴充后的明文索引進行加密,從而得到空間對象的密文索引Ii。
5.根據權利要求4所述的一種語義理解的密文空間關鍵字檢索方法中的明文索引分割和加密方法,其特征在于,所述擴充后的明文索引加密時,首先對其進行分割,然后對分割得到的和分別進行加密;
分割規則如下:若可搜索加密算法密鑰SK中的二進制向量S的第j位為0,和都置為若S的第j位為1,和置為兩個隨機數,其和為
加密過程如下:用可搜索加密算法密鑰SK中的{M1,M2}分別點乘得到每個空間對象oi的密文索引
6.根據權利要求1所述的一種語義理解的密文空間關鍵字檢索方法,其特征在于,步驟4中所述查詢語句中關鍵字的查詢-主題概率分布向量Qw的確定方法如下:
其中,Pt為文本集-主題概率分布向量;Pw為詞語-文本集概率分布向量;MK是詞語-主題概率分布矩陣,Qd為查詢關鍵字集合,|Qd|為查詢關鍵詞個數;o符號為向量間的哈達瑪積。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011135390.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種骶神經穿刺導板及其構建方法
- 下一篇:一種面部整容整形用手術治療床





