[發(fā)明專利]文件搜索系統(tǒng)和程序有效
| 申請?zhí)枺?/td> | 201080040672.5 | 申請日: | 2010-09-03 |
| 公開(公告)號: | CN102483765A | 公開(公告)日: | 2012-05-30 |
| 發(fā)明(設(shè)計)人: | 衛(wèi)藤達(dá)也;松浦正和;鶴田誠也 | 申請(專利權(quán))人: | 株式會社日立解決方案 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F12/00 |
| 代理公司: | 北京安信方達(dá)知識產(chǎn)權(quán)代理有限公司 11262 | 代理人: | 周靖;鄭霞 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文件 搜索 系統(tǒng) 程序 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及提前對接受搜索的文件創(chuàng)建索引文件,并且通過參考索引文件來搜索文件的文件搜索系統(tǒng)和程序。
背景技術(shù)
近年來,信息的數(shù)字化發(fā)展迅速。過去,數(shù)字化主要涉及將待參考的數(shù)據(jù)存儲在文件和DB(數(shù)據(jù)庫)中,以使企業(yè)、對外辦事處等等的計算機系統(tǒng)進(jìn)行核心操作,這樣的數(shù)據(jù)包括銀行賬戶、城市/城鎮(zhèn)/村莊居民登記等等。
另一方面,目前,在諸如企業(yè)等等的組織的日常經(jīng)營中創(chuàng)建的各種文檔作為文檔文件存儲在每個員工的客戶端PC(個人計算機)上,并且作為電子郵件附件傳輸至其他的客戶端PC,或存儲在文件服務(wù)器上作為整個組織的共享信息。此外,存儲在文件服務(wù)器上的文檔文件被各個員工參考,并且有時被復(fù)制到客戶端PC和在客戶端PC上更新。
因為大量的數(shù)字信息因此分布和存儲在各種計算機上,所以完全一樣或相似的數(shù)字信息最終在組織內(nèi)大量地存在。此外,各種數(shù)字信息的存儲量也在繼續(xù)增長。
另一方面,在組織內(nèi),例如,經(jīng)常出現(xiàn)的情況是人們可能希望參考其存儲位置未知的數(shù)字信息,例如當(dāng)需要由已經(jīng)離開組織的前員工在過去創(chuàng)建的文檔文件時等等。在這樣的情況下,通常的做法是,使用預(yù)期在關(guān)心的文檔文件中找到的關(guān)鍵詞通過全文搜索等等來搜索文檔文件等等。
順便說一下,如果要在組織內(nèi)的所有的計算機中搜索數(shù)字信息,那么每個員工的客戶端PC還將必須允許來自所有的員工的訪問,這在安全性方面是不期望的。因此,通常的作法是將要在整個組織中共享的數(shù)字信息存儲在預(yù)定的文件服務(wù)器上。
然而,即使文檔文件等等被存儲在多個預(yù)定的文件服務(wù)器上,如果人們在每次需要文檔文件時搜索存儲在文件服務(wù)器上的所有文件,那么將需要大量的時間執(zhí)行文件I/O(輸入/輸出)等等。
由于該原因,在專利文獻(xiàn)1中已知以下技術(shù),其中,對于存儲在文件服務(wù)器上的文檔文件等等,用于搜索的相對少量的信息(索引信息),例如存儲位置、關(guān)鍵詞等等被作為索引文件存儲。具體地,通過創(chuàng)建索引文件,可以在搜索期間通過一次文件I/O獲得與多個文件相關(guān)的索引信息,由此避免針對每個文檔文件執(zhí)行文件I/O的需要等等。作為結(jié)果,可以縮短在文件搜索期間的響應(yīng)時間,并且可以減小文件服務(wù)器上的負(fù)荷。
引用列表
專利文獻(xiàn)
專利引用1:日本專利公布(特開昭)No.2003-162545A
發(fā)明概述
技術(shù)問題
然而,為了通過諸如專利文獻(xiàn)1中公開的技術(shù)進(jìn)行文件搜索,必需創(chuàng)建所有接受搜索的文件的索引文件。
雖然索引信息的儲存容量與實際的文件相比是相對小的,但是為了能夠通過關(guān)鍵詞進(jìn)行全文搜索,必需的是分析文件中含有的關(guān)鍵詞并且將它們存儲在索引信息中。因此,當(dāng)文件中含有的關(guān)鍵詞的數(shù)量增加時,相應(yīng)地需要更大的容量。因此,當(dāng)待接受搜索的文件的數(shù)量增加時,索引文件的儲存容量變得更大。
現(xiàn)在考慮例如在組織內(nèi)的文件搜索,即使當(dāng)文件存儲在共享的文件服務(wù)器上時,經(jīng)常的情況是每個部門具有對有限的文件夾等等的訪問權(quán)限,文件存儲在這些有限的文件夾下等等,并且在其中進(jìn)行搜索。在這樣的情況下,經(jīng)常采用的方法是文件夾被給予例如“work?report文件夾”和類似的名稱,并且符合這些名稱的文件被存儲在相應(yīng)的文件夾中,即將文件以文件夾的方式進(jìn)行分類的方法。此外,在這樣的情況下,由于可以通過按照文件夾的樹形結(jié)構(gòu)檢索到所關(guān)心的文件,所以幾乎不需要通過關(guān)鍵詞的全文搜索。
因此,即使文件存儲在錯誤的文件夾中,只要具有關(guān)于文件的意圖、標(biāo)題等等的小容量的索引文件,那么通過參考索引文件中的索引信息,搜索經(jīng)常是可能的。
換句話說,對于在組織內(nèi)創(chuàng)建的諸如文檔等等的文件,只要具有關(guān)于文件的意圖、標(biāo)題等等的小容量的索引文件,那么搜索經(jīng)常是可能的。另一方面,例如,對于從組織的外部獲得的文件,例如專利文件、技術(shù)論文等等,或?qū)τ谠诮M織外部的服務(wù)器例如web服務(wù)器等等上存在的文件,還經(jīng)常為了在獲得它們時未打算的目的而參考它們,經(jīng)常需要通過關(guān)鍵詞進(jìn)行全文搜索。
因此,考慮在組織內(nèi)的文件搜索,具有應(yīng)當(dāng)允許全文搜索的文件以及全文搜索對于其而言不必要的文件。這不但適用于組織,而且適用于例如由個人進(jìn)行的文件搜索。
考慮到以上的情況,本發(fā)明的一個目的是,提供文件搜索系統(tǒng)和程序,其通過關(guān)于其中應(yīng)當(dāng)允許全文搜索的文件和全文搜索不必要的文件共存的文件搜索環(huán)境,創(chuàng)建在應(yīng)當(dāng)允許全文搜索的文件和全文搜索不必要的文件之間的不同的索引文件,來進(jìn)行有效的搜索。
問題的解決方案
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社日立解決方案,未經(jīng)株式會社日立解決方案許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080040672.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:光纖激光裝置
- 下一篇:具備后方監(jiān)控攝像裝置的作業(yè)車輛





