[發明專利]因特網信息資源快速檢索方法有效
| 申請號: | 201310492732.2 | 申請日: | 2013-10-21 |
| 公開(公告)號: | CN103530384B | 公開(公告)日: | 2017-01-25 |
| 發明(設計)人: | 史高升;朱濤;趙西法;韓祥松;榮麗萍 | 申請(專利權)人: | 政和科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 濟南誠智商標專利事務所有限公司37105 | 代理人: | 王汝銀 |
| 地址: | 250101 山東省濟南市高新*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 因特網 信息資源 快速 檢索 方法 | ||
技術領域
本發明涉及因特網信息檢索領域,具體說是一種因特網信息資源快速檢索方法。
背景技術
隨著互聯網技術的不斷發展,以搜索引擎為首的互聯網應用,在日益廣泛滲透到中國經濟、文化、政治生活的各個領域。網絡信息資源具有數量巨大,更新迅速的特點,如何在海量的互聯網信息中快速準確的檢索出人們所需要的信息資源是互聯網企業改進的方向。目前,搜索信息是從數據庫中進行搜索,每個數據庫都很大,因此搜索時間長,而且在數據更新后,更新的數據與原有的數據混合到一個新的數據庫中,這樣搜索起來更加麻煩。
發明內容
為了克服上述現有技術存在的缺點,本發明的目的在于提供一種實現分塊索引,提升索引速度的因特網信息資源快速檢索方法。
為了解決上述問題,本發明采用以下技術方案:一種因特網信息資源快速檢索方法,包括以下步驟:
S1,定義一套索引文件格式,建立文檔類,用于存放文件索引及索引范圍的記錄;
S2,將數據庫中的目標文件轉換為二進制文件,生成索引目錄,并在索引目錄前進行編號,其中,所述目標文件包括網頁、文件和數據庫記錄;
S3,建立字段描述類,用于存放單個字段的各種屬性;
S4,在文檔被索引之前,首先對文檔內容進行分詞處理;
S5,把每個索引文檔加入到與其對應的文檔對象中;
S6,將用戶查找的關鍵字封裝成所在二進制文件易于識別的形式;
S7,建立一個用戶保存搜索結果的對象,用于用戶保存查找結果;
S8,解析用戶輸入的搜索關鍵字,根據關鍵字排他字典對關鍵字進行處理;
S9,建立數據轉化類,將搜索結果轉化為網頁顯示所需要的格式;
S10,通過套用顯示模板,把搜索結果轉化成頁面展示所需的格式。
當增加新的數據記錄文件時,S1步驟中建立一個小文件索引,所述小文件索引與原有的文件索引為并列關系。
S1步驟中定義的索引文件格式為8位字節或16位字節。
本發明的有益效果是:它通過建立文檔類,較以前的數據庫分類更細,實現了分塊檢索,大大提升了檢索速度,而且,在有新的數據產生時,會把新數據建立一個小文件索引,它與原有的索引文件并列,這樣就加快了對新數據的索引速度。
附圖說明
下面結合附圖和實施例對本發明做進一步的說明:
圖1為本發明的流程框圖;
圖2為本發明的系統結構示意圖。
具體實施方式
如圖1所示,本發明的一實施方式包括一下步驟:
S1,定義一套索引文件格式,建立文檔類,用于存放文件索引及索引范圍的記錄;
S2,將數據庫中的目標文件轉換為二進制文件,生成索引目錄,并在索引目錄前進行編號,其中,所述目標文件包括網頁、文件和數據庫記錄;
S3,建立字段描述類,用于存放單個字段的各種屬性;
S4,在文檔被索引之前,首先對文檔內容進行分詞處理;
S5,把每個索引文檔加入到與其對應的文檔對象中,方便后續的查找操作;
S6,將用戶查找的關鍵字封裝成所在二進制文件易于識別的形式;
S7,建立一個用戶保存搜索結果的對象,用于用戶保存查找結果;
S8,解析用戶輸入的搜索關鍵字,根據關鍵字排他字典對關鍵字進行處理,去掉一些如“的”、“嗎”等語助詞;
S9,建立數據轉化類,將搜索結果轉化為網頁顯示所需要的格式;
S10,通過套用顯示模板,把搜索結果轉化成頁面展示所需的格式。
如圖2所示,用戶通過索引頁進行檢索,文件索引中的目錄進行編號,搜索范圍記錄也進行編號,當增加新數據時,生成新數據的小文件索引,它與原有文件索引并列,使檢索過程更加快捷;在對目標文件(包括網頁、文件、數據庫記錄等)進行檢索后,通過數據轉化類,進行算法和對應關系,將搜過結果轉化為網頁顯示所需要的格式后返回結果,進行顯示。
本發明具有一下特點:
1、索引文件格式獨立于應用平臺。本發明定義了一套8位字節為基礎的索引文件格式,當然也可以使16位等其他位數字節,使得兼容系統或者不同平臺的應用能夠共享建立的索引文件。
2、在傳統文件檢索引擎的倒排索引的基礎上,實現了分塊檢索,能夠針對新的文件建立小文件索引,提升索引速度,然后通過索引的合并,達到優化目的。
3、優秀的面向對象的系統構架,使得本搜索擴展的學習難度降低,方便擴充信功能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于政和科技股份有限公司,未經政和科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310492732.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:貫流機組轉輪室汽蝕焊補工藝
- 下一篇:樹形結構數據顯示方法與裝置





