[發明專利]一種索引文件創建同步方法和搜索系統無效
| 申請號: | 200910110347.0 | 申請日: | 2009-10-28 |
| 公開(公告)號: | CN101702158A | 公開(公告)日: | 2010-05-05 |
| 發明(設計)人: | 王有為;劉克鴻;劉飛;楊旗;楊豐;馬慧;蔣錚 | 申請(專利權)人: | 卓望數碼技術(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市順天達專利商標代理有限公司 44217 | 代理人: | 李琴 |
| 地址: | 518057 廣東省深圳市南山區高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 索引 文件 創建 同步 方法 搜索 系統 | ||
技術領域
本發明涉及搜索技術,更具體地說,涉及一種索引文件創建同步方法和搜索系統。
背景技術
隨著數字化信息存儲技術的日漸成熟,信息的全文檢索得到了廣泛的應用。從互聯網搜索引擎,到圖書館圖書搜索,信息全文檢索技術的應用隨處可見。
面對龐大的信息庫,為提高全文檢索的效率,往往需要對信息構建索引。以互聯網搜索引擎為例,搜索引擎公司必須對每天挖掘的大量網頁數據構建索引,才能保障每日數以千萬計的網頁搜索請求得到快速的響應。然而,現有索引構建方法往往需要占用大量的系統資源,對于大型數據庫而言,往往需要配置專門的索引設備來執行索引構建任務。
在現有技術中,通過配置索引服務器來完成索引構建任務。在這種情況下,具體的搜索任務(即將輸入的關鍵字與構建的索引進行匹配,以輸出搜索結果)將由專門的搜索服務器來完成。
由于索引文件經常更新,因此需要在索引服務器和搜索服務器之間同步索引文件。現有技術通常采用FTP傳送方式來同步索引文件。盡管可以完成索引文件的傳送任務,但FTP傳送方式存在諸多缺陷。例如,首先,FTP傳送方式需要進行較為復雜的FTP配置。其次,在具體使用過程中,FTP傳送方式需要進行一系列交互式的應用層操作。再次,FTP傳送方式在每次傳送過程開始前都需要進行密碼驗證,在驗證成功后方可以開始傳遞,如果FTP驗證密碼發生變化例如經過修改,則發送方無法再使用原有密碼進行文件傳送。由此可見,FTP傳送方式的操作過程十分復雜。
因此,需要一種索引文件構建同步方案,以解決現有技術之中存在的索引文件構建方案占用系統資源過多以及現有基于FTP傳送方式的索引文件同步方案操作過程相對復雜的缺陷。
發明內容
本發明要解決的技術問題在于,針對現有索引構建方案占用系統資源過多以及現有基于FTP傳送方式的索引文件同步方案操作過程相對復雜的缺陷,提供一種索引文件創建同步方法和搜索系統。
本發明解決其技術問題所采用的技術方案是:
構造一種索引文件創建同步方法,包括:
創建步驟,包括:
S1、索引服務器接收索引更新命令,提取其中包含的業務標識,在該業務標識對應的、位于本地的源目錄下讀取源業務文件;
S2、索引服務器在判定讀取的源業務文件與該業務標識對應的、位于本地的目標目錄下的目標業務文件不同時,依據所述源業務文件對所述目標業務文件進行更新;
S3、索引服務器為更新后的目標業務文件生成索引文件,依據該索引文件對所述業務標識對應的、位于本地的第一索引文件目錄下的索引文件進行更新;
同步步驟,包括:
索引服務器執行將更新后的索引文件復制到通過SSHFS進程掛接到搜索服務器上的第二索引文件目錄的本地虛擬目錄下的操作,以通過SSHFS進程將更新后的索引文件傳送到所述搜索服務器上的第二索引文件目錄下。
在本發明提供的索引文件創建同步方法中,所述索引更新命令在到達所述業務標識對應的索引更新時間時被觸發。
在本發明提供的索引文件創建同步方法中,在所述創建步驟中,在所述步驟S2中,在下列情況下,判定所述源業務文件與所述目標業務文件不同:
所述源業務文件的MD5校驗值與所述目標業務文件的MD5校驗值不同;
所述源業務文件的修改時間與所述目標業務文件的修改時間不同;
所述源業務文件的文件大小與所述目標業務文件的文件大小不同。
在本發明提供的索引文件創建同步方法中,所述同步步驟具體包括所述索引服務器基于所述更新后的索引文件的更新時間戳,執行將該索引文件復制到所述本地虛擬目錄下由該更新時間戳標識的子目錄下的操作,以通過所述SSHFS進程將該索引文件傳送到所述搜索服務器的第二索引文件目錄下由該更新時間戳標識的子目錄下。
在本發明提供的索引文件創建同步方法中,在所述同步步驟中,在所述更新后的索引文件復制完成之后,所述方法還包括,所述索引服務器向所述搜索服務器發出完成通知。
本發明還提供了一種搜索系統,包括:
搜索服務器,其上設置有第二索引文件目錄;
索引服務器,與搜索服務器通信連接,用于執行以下操作:
創建操作,包括:
接收索引更新命令,提取其中包含的業務標識,在該業務標識對應的、位于本地的源目錄下讀取源業務文件;
在判定讀取的源業務文件與該業務標識對應的、位于本地的目標目錄下的目標業務文件不同時,依據所述源業務文件對所述目標業務文件進行更新;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于卓望數碼技術(深圳)有限公司,未經卓望數碼技術(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910110347.0/2.html,轉載請聲明來源鉆瓜專利網。





