[發明專利]密文全文檢索系統有效
| 申請號: | 201010187384.4 | 申請日: | 2010-05-31 |
| 公開(公告)號: | CN101859323A | 公開(公告)日: | 2010-10-13 |
| 發明(設計)人: | 霍林;黃保華;胡和平;覃海生;黃俊文;王力;潘英花;李瑞軒;李德順;譚穎璐;邢霄;鄒先澤 | 申請(專利權)人: | 廣西大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣西南寧匯博專利代理有限公司 45114 | 代理人: | 黃萍 |
| 地址: | 530004 廣西壯族自*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 全文 檢索系統 | ||
1.密文全文檢索系統,包括有原始文本處理模塊、分詞模塊、加密模塊、文檔密文存儲模塊、密文索引模塊、密文檢索模塊、檢索結果處理模塊、系統管理模塊;其特征在于:
所述原始文本處理模塊(100),用于對文檔的原始文本進行格式化預處理,包括但不限于電子化紙質文檔和/或格式化電子原始文檔,并提取其主題、正文及附加屬性信息,以及,形成文檔概要;
所述分詞模塊(200),用于對所述原始文本處理模塊所提供的文檔主題、正文及附加屬性進行分詞并提取特征向量,以及,用于對所述密文檢索模塊提供的檢索詞/串進行分詞和查詢擴展;
所述加密模塊(300),對包括但不限于所述原始文本處理模塊傳送過來的純文本文檔、文檔概要,所述分詞模塊傳送來的特征向量、分詞進行加密操作,并將所述特征向量密文存入特征向量密文庫;對由密文索引模塊傳送過來的分詞位置信息進行加/解密操作;對包括但不限于所述文檔密文存儲模塊傳送來的文檔密文、文檔概要密文進行解密;對經所述檢索結果處理模塊傳送來的特征向量密文進行解密;并向所述文檔密文存儲模塊、檢索結果處理模塊、密文檢索模塊、密文索引模塊提供經加/解密的相應數據;
所述文檔密文存儲模塊(400),用于分布存儲、提供文檔密文和文檔概要密文:所述分布是按照地域、文檔密級和文檔分類來決定相應密文所存向的目標文檔密文服務器,各文檔密文服務器接收并存儲來自所述加密模塊提供的文檔密文和文檔概要密文;本模塊還接受所述檢索結果處理模塊的密文讀取請求,為加密模塊提供需要解密的密文;
所述密文索引模塊(500),用于分布密文分詞并創建、存儲密文索引,提供需要解密的密文索引,及檢索到的文檔編號:所述分布是按照地域、文檔密級和文檔分類來決定相應密文索引所存向的目標索引服務器;各索引服務器接收來自所述加密模塊提供的密文分詞和分詞位置信息并進行索引創建;經加密后存儲密文索引到相應的密文索引庫;本模塊還根據所述密文檢索模塊的密文分詞檢索請求,從密文索引庫中檢索到需要解密的索引分詞位置信息密文并傳送到加密模塊,及,將從加密模塊返回的文檔編號集發送給密文檢索模塊;
所述密文檢索模塊(600),為系統的合法用戶提供相應級別的信息檢索服務;該模塊接收合法用戶輸入的檢索詞/串,經審查過濾后提交給所述分詞模塊;接收加密模塊發送來的擴展密文分詞集并形成密文分詞檢索請求,然后傳送到所述密文索引模塊進行檢索;接收密文索引模塊返回的文檔編號集,并提交給所述檢索結果處理模塊;
所述檢索結果處理模塊(700),用來接收并處理所述密文檢索模塊提供的文檔編號集,并將經過排序處理后得到的結果集返回給檢索用戶;根據所述密文檢索模塊提供的文檔編號集,從特征向量密文庫中取出相應的特征向量密文,經加密模塊解密后對文檔編號集合進行排序;把有序的文檔編號集發送給文檔密文存儲模塊;接收經所述加密模塊解密的相應文檔概要并顯示給用戶;根據用戶選擇的文檔概要明文提取相應文檔密文,經加密模塊解密后顯示給用戶,其提取方式與提取文檔概要明文相同;
所述系統管理模塊(800),用來管理用戶權限,對部門、角色、用戶的基本信息以及它們之間的映射關系進行維護更新等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西大學,未經廣西大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010187384.4/1.html,轉載請聲明來源鉆瓜專利網。





