[發(fā)明專利]使用拼音檢索文件的文件檢索方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201410116225.3 | 申請(qǐng)日: | 2014-03-27 |
| 公開(kāi)(公告)號(hào): | CN103838876B | 公開(kāi)(公告)日: | 2017-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 劉焱青;賀旺喜;張熠轉(zhuǎn);陳凌軒 | 申請(qǐng)(專利權(quán))人: | 烽火通信科技股份有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京捷誠(chéng)信通專利事務(wù)所(普通合伙)11221 | 代理人: | 魏殿紳,龐炳良 |
| 地址: | 430074 湖北省武*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 使用 拼音 檢索 文件 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及文件檢索,具體涉及使用拼音檢索文件的文件檢索方法及系統(tǒng)。
背景技術(shù)
在文件檢索系統(tǒng)中,如果本地文件系統(tǒng)中包含有多種語(yǔ)言的文件,通常的作法是除了通過(guò)輸入關(guān)鍵詞檢索文件系統(tǒng)中匹配的文件外,還需要通過(guò)將輸入關(guān)鍵詞中的拼音字母翻譯成中文漢字形成一個(gè)或多個(gè)與之相匹配的新關(guān)鍵詞,再次檢索文件系統(tǒng)中匹配的文件,累積檢索出來(lái)的結(jié)果為用戶最終檢索結(jié)果,從而實(shí)現(xiàn)在全名檢索文件的基礎(chǔ)上實(shí)現(xiàn)拼音檢索文件的功能。
然而,由于許多漢字都存在多音字,并且漢字拼音有四個(gè)聲調(diào),因此同一個(gè)漢字拼音可能有4種不同的多音字,這樣,把用字母輸入的關(guān)鍵詞當(dāng)作拼音翻譯成中文漢字后,用戶輸入的一個(gè)關(guān)鍵詞就有可能被翻譯成一個(gè)或多個(gè)漢字關(guān)鍵詞,特別是翻譯拼音首字母形式的關(guān)鍵詞,在通過(guò)這些關(guān)鍵詞對(duì)文件系統(tǒng)中的文件進(jìn)行檢索。這樣翻譯生成的關(guān)鍵詞,其中翻譯生成的關(guān)鍵詞會(huì)存在很多冗余搜索(因?yàn)槲募到y(tǒng)中根本不存在這樣的文件),而且這樣將耗費(fèi)很長(zhǎng)的檢索時(shí)間完成檢索,從而使檢索效率低下。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是的問(wèn)題。
為了解決上述技術(shù)問(wèn)題,本發(fā)明所采用的技術(shù)方案是提供一種使用拼音檢索文件的方法,包括以下步驟:
步驟A10:逐個(gè)掃描文件系統(tǒng)中的文件,并將掃描到的文件名逐一翻譯生成拼音首字母形式和拼音全拼形式的字符串,然后將每一個(gè)文件對(duì)應(yīng)的拼音首字母字符串、拼音全拼字符串以及文件名全名、文件全路徑和所屬文件系統(tǒng)名生成一條文件索引記錄,形成文件索引;一條文件索引記錄的格式如圖4、圖5中右部分所示。
步驟A20:在檢索內(nèi)容欄中輸入待檢索的文件名并選擇檢索意愿方式,所述用戶檢索意愿方式為基于拼音首字母、基于拼音全拼或基于文件名全名用戶檢索;
步驟A30、根據(jù)所述檢索關(guān)鍵詞和所述用戶檢索意愿從所述文件索引中檢索到與之匹配的文件索引記錄;
步驟A40、顯示檢索結(jié)果,并根據(jù)用戶的操作對(duì)檢索到的所述文件索引記錄執(zhí)行相應(yīng)的操作。
在上述方法中,根據(jù)用戶檢索意愿對(duì)所有與關(guān)鍵詞匹配的文件索引記錄進(jìn)行優(yōu)先排序。
在上述方法中,根據(jù)檢索關(guān)鍵詞,只檢索與檢索意愿相關(guān)的文件索引記錄。
在上述方法中,還包括文件索進(jìn)行引實(shí)時(shí)更新,具體步驟如下:
實(shí)時(shí)或定時(shí)掃描與檢測(cè)文件系統(tǒng)的文件和文件變更;
根據(jù)文件系統(tǒng)的文件和文件變更情況,實(shí)時(shí)更新文件索引,對(duì)于新增的文件系統(tǒng),對(duì)該文件系統(tǒng)中的文件進(jìn)行逐個(gè)掃描,對(duì)掃描到的文件名逐一翻譯生成拼音首字母形式和拼音全拼形式的字符串,并結(jié)合文件名全名、文件全路徑以及所屬文件系統(tǒng)名生成文件索引記錄,更新到文件索引中;對(duì)于移除的文件系統(tǒng),直接刪除文件索引中對(duì)應(yīng)該文件系統(tǒng)名的所有文件索引記錄;對(duì)于新增文件或更改文件名的文件,將該文件的文件名翻譯成拼音首字母形式和拼音全拼形式的字符串,并結(jié)合文件名全名新增一條索引記錄到文件索中;對(duì)于刪除的文件,根據(jù)刪除文件的文件名刪除對(duì)應(yīng)的文件索引記錄。
本發(fā)明還提供了一種文件檢索系統(tǒng),包括索引生成裝置和檢索裝置;
所述索引生成裝置包括掃描單元、翻譯服務(wù)單元和索引生成單元,所述掃描單元逐個(gè)掃描文件系統(tǒng)中的文件;所述翻譯服務(wù)單元將掃描到的文件名逐一翻譯生成拼音首字母形式和拼音全拼形式的字符串;所述索引生成單元將每一個(gè)文件對(duì)應(yīng)的拼音首字母字符串、拼音全拼字符串以及文件名全名、文件全路徑和所屬文件系統(tǒng)名生成一條文件索引記錄,形成文件索引;
所述檢索裝置包括輸入單元、文件檢索單元和檢索結(jié)果輸出單元,用戶通過(guò)所述輸入單元輸入待檢索的文件名以及檢索意愿方式,所述用戶檢索意愿方式為基于拼音首字母、基于拼音全拼或基于文件名全名用戶檢索;所述文件檢索單元根據(jù)所述檢索關(guān)鍵詞和所述用戶檢索意愿從所述文件索引中檢索到與之匹配的文件索引記錄;所述檢索結(jié)果輸出單元顯示檢索到的文件索引記錄。
在上述文件檢索系統(tǒng),所述索引生成裝置上還設(shè)有還包括文件系統(tǒng)監(jiān)測(cè)單元和索引管理單元,所述文件系統(tǒng)監(jiān)測(cè)單元實(shí)時(shí)或定時(shí)監(jiān)測(cè)文件系統(tǒng)的變更以及文件系統(tǒng)中的文件變更,并發(fā)出相應(yīng)的變更請(qǐng)求,所述索引管理單元根據(jù)所述變更請(qǐng)求實(shí)時(shí)更新文件索引中的相關(guān)文件索引記錄。
本發(fā)明,將文件系統(tǒng)中的文件通過(guò)拼音首字母,拼音全拼和文件全名形式生成文件索引,用戶檢索時(shí)直接將輸入的關(guān)鍵詞在生成的文件索引中進(jìn)行檢索,可以避免對(duì)輸入關(guān)鍵詞進(jìn)行翻譯的過(guò)程,并且有效減少一些不必要的檢索過(guò)程,提高檢索效率。
附圖說(shuō)明
圖1為本發(fā)明中文件檢索系統(tǒng)的示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于烽火通信科技股份有限公司,未經(jīng)烽火通信科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410116225.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





