[發明專利]一種基于開源架構的便捷化全文檢索方法在審
| 申請號: | 201710462817.4 | 申請日: | 2017-06-19 |
| 公開(公告)號: | CN109145077A | 公開(公告)日: | 2019-01-04 |
| 發明(設計)人: | 王鵬;黃樹桃;趙永安;余靖毅 | 申請(專利權)人: | 核工業北京地質研究院 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F16/338;G06F16/25;G06F16/28 |
| 代理公司: | 核工業專利中心 11007 | 代理人: | 包海燕 |
| 地址: | 100029 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 架構 全文檢索 數據資源 全文檢索功能 全文檢索系統 設計和開發 擴展性 數據流 功能設計 技術成本 技術開發 技術框架 經濟成本 快速檢索 流程設計 數據檢索 索引構建 完成系統 物理拓撲 系統擴展 系統實現 應用需求 靈活的 全配置 信息技術 應用 部署 維護 | ||
1.一種基于開源架構的便捷化全文檢索方法,其特征在于:包括以下步驟:
步驟S1全文檢索系統平臺物理拓撲架構和技術開發方案架構設計;
步驟S2全文檢索功能流程設計;
步驟S3全文檢索系統平臺開發實現。
2.根據權利要求1所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S1中,所述物理拓撲架構的部署思路為:根據數據流向,按照數據存儲層-應用服務層-緩存層-負載均衡層的分層方式進行設置。
3.根據權利要求2所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S1中,所述技術開發方案架構的具體技術實現是以開源數據庫為數據存儲容器,采用B/S架構,基于Eclipse編程開發平臺,采用面向對象的JAVA編程語言,進行全文檢索系統詳細功能設計以及開發實現。
4.根據權利要求3所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S1中,所述開源數據庫為PostgreSQL數據庫或MySQL數據庫。
5.根據權利要求1所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S2包括以下步驟:
步驟S21索引構建與索引維護策略設計;
步驟S22全過程數據流設計。
6.根據權利要求5所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:
步驟S21所述索引構建是在系統功能對象交互的基礎上,根據用戶交互的請求參數,啟動構建文檔索引的實例;隨后依次遍歷數據集合中的所有文檔,對文檔記錄以及屬性內容進行分詞處理,構建倒排索引;最后,將倒排索引及其相關輔助信息持久化地存儲到服務器磁盤,生成索引文件;
步驟S21所述索引維護依靠人工或者命令腳本,在后續數據更新的基礎上,實現定期的索引重新構建。
7.根據權利要求6所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S22所述全過程數據流的設計如下所述:索引文件生成之后,用戶通過系統界面發送進行全文檢索的請求,首先由文檔全文檢索請求分析器進行請求的捕獲和預處理;然后將查詢參數中的查詢語句根據特征詞庫,進行分詞,得到詞項數組;接下來根據已經生成好的索引文件,進行關鍵詞匹配,得到候選文檔集合,計算候選文檔集合中文檔與查詢語句的相似度,得到文檔評分并進行排序,最后返回查詢結果至瀏覽器頁面進行發布展示。
8.根據權利要求7所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S22中,用戶發送數據下載請求,系統解析相關用戶請求,并訪問數據資源的存儲服務器,根據數據資源存儲位置,獲取相應數據資源的字節流,最終實現數據資源的本地下載。
9.根據權利要求1所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S3中,在全文檢索功能流程解決基礎上,充分考慮數據資源當前與將來應用的擴展性和適用性,確定系統實現的技術框架,同時采用全配置式部署支持快速靈活的實現系統擴展,為后續系統功能升級和用戶拓展提供有力應用支持。
10.根據權利要求1或9所述的一種基于開源架構的便捷化全文檢索方法,其特征在于:步驟S3中,所述全文檢索系統采用兼容支持移動瀏覽器的表現技術。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于核工業北京地質研究院,未經核工業北京地質研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710462817.4/1.html,轉載請聲明來源鉆瓜專利網。





