[發(fā)明專利]基于局部敏感哈希的中文多關(guān)鍵詞模糊排序密文搜索方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710387493.2 | 申請(qǐng)日: | 2017-05-26 |
| 公開(公告)號(hào): | CN107220343B | 公開(公告)日: | 2020-09-01 |
| 發(fā)明(設(shè)計(jì))人: | 楊旸;劉佳;郭文忠;葉少珍;董晨 | 申請(qǐng)(專利權(quán))人: | 福州大學(xué) |
| 主分類號(hào): | G06F16/31 | 分類號(hào): | G06F16/31;G06F16/33;G06F21/62 |
| 代理公司: | 福州元?jiǎng)?chuàng)專利商標(biāo)代理有限公司 35100 | 代理人: | 蔡學(xué)俊 |
| 地址: | 350108 福建省福州市*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 局部 敏感 中文 關(guān)鍵詞 模糊 排序 搜索 方法 | ||
1.一種基于局部敏感哈希的中文多關(guān)鍵詞模糊排序密文搜索方法,其特征在于,提供一數(shù)據(jù)擁有單元、一授權(quán)用戶單元以及一云服務(wù)器,按照如下步驟實(shí)現(xiàn):
步驟S1:初始化,所述數(shù)據(jù)擁有單元從明文文檔集合F=(f1,f2,…,fm)中抽取關(guān)鍵詞,得到關(guān)鍵詞集合W=(w1,w2,…,wn);
步驟S2:生成密鑰,所述數(shù)據(jù)擁有單元輸入一預(yù)設(shè)安全參數(shù)λ,產(chǎn)生一個(gè)向量S∈{0,1}λ,以及兩個(gè)λ×λ維的可逆矩陣{M1,M2},密鑰SK由三元組{S,M1,M2}組成,所述數(shù)據(jù)擁有單元生成文檔加密密鑰sk;
步驟S3:建立索引,所述數(shù)據(jù)擁有單元從一LSH哈希族中選取l個(gè)獨(dú)立的LSH函數(shù),為每篇文檔fi構(gòu)建一個(gè)λ比特的布隆過濾器,作為文檔fi的索引Ii;
步驟S4:索引加密,采用安全KNN算法加密索引Ii,得到加密后的索引EncSK(I)=(EncSK(I1),EncSK(I2),…EncSK(Im)),其中Ii',Ii”表示加密索引Ii隨機(jī)分裂后的向量,I表示關(guān)鍵詞索引集合I=(I1,…,Im);所述數(shù)據(jù)擁有單元將加密的索引集合EncSK(I)上傳到所述云服務(wù)器;
步驟S5:文檔加密,所述數(shù)據(jù)擁有單元通過對(duì)稱加密算法對(duì)所述文檔集合F=(f1,f2,…,fm)進(jìn)行加密,得到密文集合C=(c1,c2,…,cm),并上傳給所述云服務(wù)器;
步驟S6:生成陷門,當(dāng)授權(quán)用戶搜索時(shí),通過所述授權(quán)用戶單元輸入η個(gè)搜索關(guān)鍵詞Q=(q1,q2,…,qη),并為查詢關(guān)鍵詞集合Q構(gòu)建一個(gè)λ比特的布隆過濾器作為陷門TQ;
步驟S7:陷門加密,采用安全KNN算法對(duì)陷門TQ加密,得到加密后的陷門其中TQ',TQ”表示陷門TQ隨機(jī)分裂后的向量;所述授權(quán)用戶單元將加密后的陷門EncSK(TQ)上傳到所述云服務(wù)器;
步驟S8:所述云服務(wù)器根據(jù)加密的索引EncSK(Ii)和加密的陷門EncSK(TQ),計(jì)算文檔的相似度分?jǐn)?shù),將所有分?jǐn)?shù)排序后,返回前k篇文檔給用戶;
步驟S9:所述授權(quán)用戶單元通過使用所述數(shù)據(jù)擁有單元分發(fā)的密鑰sk,對(duì)返回的top-k篇密文進(jìn)行解密,獲得所需的明文文檔集;
在所述步驟S3中,還包括如下步驟:
步驟S31:采用基于拼音串的中文關(guān)鍵詞向量生成算法為文檔fi中的每個(gè)關(guān)鍵詞wj生成對(duì)應(yīng)的關(guān)鍵詞向量則文檔fi的關(guān)鍵詞向量集合為
步驟S32:通過hσ∈H,對(duì)每一個(gè)關(guān)鍵詞向量進(jìn)行哈希操作,并插入到布隆過濾器Ii中,其中,1≤σ≤l,H表示哈希函數(shù)集合,hσ表示一個(gè)具體的哈希函數(shù);
所述基于拼音串的中文關(guān)鍵詞向量生成算法按照如下步驟實(shí)現(xiàn):
步驟SA11:將中文關(guān)鍵詞轉(zhuǎn)化成對(duì)應(yīng)的拼音字符串;
步驟SA12:將每一個(gè)關(guān)鍵詞按聲母、韻母分割,分別用1、2、3、4表示音節(jié)的四個(gè)音調(diào);
步驟SA13:在音調(diào)后加入1、2、3、4來表示關(guān)鍵詞的第1、2、3、4個(gè)字,建立關(guān)鍵詞的聲母集、韻母集以及音調(diào)集;
步驟SA14:將關(guān)鍵詞的聲母集、韻母集和音調(diào)集中的元素映射到關(guān)鍵詞向量中對(duì)應(yīng)的位置上;若所獲取的音節(jié)分割集pi中包含中第j位對(duì)應(yīng)的元素,則否則
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710387493.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 可測(cè)量片外橫向偏導(dǎo)的橫向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置位置軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置敏感柵中心軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置敏感柵外側(cè)軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置敏感柵中心橫向偏導(dǎo)的橫向偏差三敏感柵叉指金屬應(yīng)變片
- 三軸硅微加速度計(jì)
- 三軸硅微加速度計(jì)
- 一種用于大噸位傳感器的自定位應(yīng)變計(jì)
- 用于簡(jiǎn)化懸臂梁傳感器的全橋箔式電阻應(yīng)變計(jì)
- 一種敏感文件管理方法





