[發明專利]一種基于多源異構系統的安全全文檢索系統和方法有效
| 申請號: | 202110054652.3 | 申請日: | 2021-01-15 |
| 公開(公告)號: | CN112784014B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 何騰蛟;張婷;韓飛;李慶;曾輝;幸陽文;鄒瑞璋;吳斌;汪冉 | 申請(專利權)人: | 中國核動力研究設計院 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/31;G06F21/31;G06F21/60;G06V30/40 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 張超 |
| 地址: | 610000 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多源異構 系統 安全 全文 檢索系統 方法 | ||
本發明公開了一種基于多源異構系統的安全全文檢索系統,應用系統模塊中存儲有源數據,源數據包括原始數據和處理后數據,處理后數據為源數據通過OCR服務模塊OCR識別后的數據,為源數據建立索引信息,并將其傳送給檢索服務模塊;存儲索引信息,根據用戶的檢索請求,提取出檢索結果列表,用戶訪問應用系統中對應檢索結果列表的源數據;將原始數據交給OCR服務模塊處理時,進行系統身份認證;向檢索服務模塊傳送索引信息時,進行系統身份認證;訪問應用系統中的對應檢索結果列表的源數據時,進行用戶身份認證。本發明可廣泛支持單位內部多源異構系統的安全全文檢索建立,尤其是存在文檔保密安全要求較高的單位對各系統統一全文檢索的需求。
技術領域
本發明涉及全文檢索技術領域,具體涉及一種基于多源異構系統的安全全文檢索系統和方法。
背景技術
隨著信息技術的發展,各類文檔管理系統越來越多、數據量越來越龐大,同時根據數據重要程度,數據訪問權限控制也納入系統管理范圍,在此環境下能夠實現跨系統的快速、全面、準確的安全全文檢索是各用戶的迫切需求。當前,全文檢索技術的發展已十分成熟,針對跨系統的檢索,其過程主要是爬取出各系統中的文本進行統一分析并建立索引,該方法建立索引時并未考慮各多源異構系統中用戶對數據的不同訪問權限,且各系統數據需被讀取出源系統,系統數據跨越邊界,數據安全性控制難以保障。與此同時,針對各系統中的非結構化文檔,要滿足全文檢索需求,還需采用OCR圖文識別工具進行處理;由于OCR識別工具是一個開放式、無差別的應用工具,各系統將內部非結構化文檔發送至OCR識別工具進行識別時,未進行針對系統級別的身份認證和數據的隔離管理,同樣無法保障數據的安全性。
發明內容
本發明所要解決的技術問題是現有技術無法滿足符合用戶訪問權限控制的安全全文檢索需求,沒有全面考慮全文檢索服務建立過程中的數據安全控制,目的在于提供一種基于多源異構系統的安全全文檢索系統和方法,解決了各應用系統數據在索引建立、數據傳輸、OCR識別管理過程中的邊界安全與訪問控制安全,滿足單位內部用戶針對系統中重要文檔的快速、準確、全面、有效全文檢索的問題。
本發明通過下述技術方案實現:
一種基于多源異構系統的安全全文檢索系統,包括:應用系統模塊、檢索服務模塊和OCR服務模塊;應用系統模塊中存儲有源數據,所述源數據包括原始數據和處理后數據,所述處理后數據為所述源數據通過所述OCR服務模塊OCR識別后的數據,應用系統模塊為所述源數據建立索引信息,并將所述索引信息傳送給所述檢索服務模塊;所述檢索服務模塊存儲所述索引信息,根據用戶的檢索請求,向用戶提取出檢索結果列表,根據所述檢索結果列表,用戶訪問應用系統中對應所述檢索結果列表的源數據;所述OCR服務模塊接收來自所述應用系統模塊的原始數據,并對所述原始數據進行OCR識別;其中,所述應用系統將所述原始數據交給所述OCR服務模塊處理時,進行系統身份認證;所述應用系統向所述檢索服務模塊傳送所述索引信息時,進行系統身份認證;用戶訪問應用系統中對應所述檢索結果列表的源數據時,進行用戶身份認證。
現有技術中全文檢索針對所有的應用系統進行檢索并訪問,對應用系統本身造成一定的安全風險及處理負擔。本發明建立單獨的檢索服務模塊為所有的應用系統提供檢索服務,所有應用系統將本系統內源數據的索引信息統一交給檢索服務模塊保管,通過檢索服務模塊來對接用戶,用戶通過檢索服務模塊獲得檢索結果列表,再由檢索結果列表跳轉到應用系統中訪問源數據。在此過程中,應用系統對用戶進行用戶身份認證,檢索服務模塊對應用系統傳送的檢索信息進行系統身份認證,保障了各系統及用戶的權限及安全問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國核動力研究設計院,未經中國核動力研究設計院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110054652.3/2.html,轉載請聲明來源鉆瓜專利網。





