[發(fā)明專利]倒排索引文件的存儲(chǔ)方法和裝置在審
| 申請?zhí)枺?/td> | 201410449591.0 | 申請日: | 2014-09-04 |
| 公開(公告)號(hào): | CN104166736A | 公開(公告)日: | 2014-11-26 |
| 發(fā)明(設(shè)計(jì))人: | 戴飛 | 申請(專利權(quán))人: | 北京國雙科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 吳貴明;張永明 |
| 地址: | 100086 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 索引 文件 存儲(chǔ) 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種倒排索引文件的存儲(chǔ)方法和裝置。
背景技術(shù)
目前,在關(guān)系數(shù)據(jù)庫系統(tǒng)中,索引是檢索數(shù)據(jù)最有效率的方式,。但對于擁有海量數(shù)據(jù)的關(guān)系數(shù)據(jù)庫,單純依靠索引對關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行檢索的方式并不能滿足對海量數(shù)據(jù)的檢索速度的要求。
倒排索引的出現(xiàn)很好的解決了對于擁有海量數(shù)據(jù)的關(guān)系數(shù)據(jù)庫的檢索效率低的問題。倒排索引是一種索引方法,被用來存儲(chǔ)在全文搜索下某個(gè)單詞在一個(gè)文檔或者一組文檔中的存儲(chǔ)位置的映射。它是文檔檢索系統(tǒng)中最常用的數(shù)據(jù)結(jié)構(gòu)。通過倒排索引,可以根據(jù)單詞快速獲取包含這個(gè)單詞的文檔列表。
但是,隨著關(guān)系數(shù)據(jù)庫的使用,倒排索引文件數(shù)量也會(huì)跟著關(guān)系數(shù)據(jù)庫中數(shù)據(jù)的增加而增加。當(dāng)大量的倒排索引文件存儲(chǔ)到同一個(gè)存儲(chǔ)介質(zhì)中的同一個(gè)倒排索引文件夾下時(shí),隨著倒排索引文件數(shù)量的增加,存儲(chǔ)介質(zhì)的尋址時(shí)間也會(huì)跟著相應(yīng)的增長。從而使得該倒排索引文件夾中的倒排序索引文件的讀取效率的降低。
針對現(xiàn)有技術(shù)中由于倒排索引文件夾中倒排索引文件過多導(dǎo)致的該倒排索引文件夾讀取速度過慢的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種倒排索引文件的存儲(chǔ)方法和裝置,以解決由于倒排索引文件夾中倒排索引文件過多導(dǎo)致的該倒排索引文件夾讀取速度過慢的問題。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種倒排索引文件的存儲(chǔ)方法。根據(jù)本發(fā)明的倒排索引文件的存儲(chǔ)方法包括:在存儲(chǔ)介質(zhì)中創(chuàng)建用于存儲(chǔ)倒排索引文件的倒排索引文件夾;為倒排索引文件夾設(shè)置閾值,閾值是創(chuàng)建新的倒排索引文件夾的判斷條件;在倒排索引文件夾的屬性超過閾值,創(chuàng)建用于存儲(chǔ)倒排索引文件的新的倒排索引文件夾。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明實(shí)施例的另一方面,提供了一種倒排索引文件的存儲(chǔ)裝置。根據(jù)本發(fā)明的倒排索引文件的存儲(chǔ)裝置包括:存儲(chǔ)模塊,用于在存儲(chǔ)介質(zhì)中創(chuàng)建用于存儲(chǔ)倒排索引文件的倒排索引文件夾;設(shè)置模塊,用于為倒排索引文件夾設(shè)置閾值,閾值是創(chuàng)建新的倒排索引文件夾的判斷條件;處理模塊,用于在倒排索引文件夾的屬性超過閾值,創(chuàng)建用于存儲(chǔ)倒排索引文件的新的倒排索引文件夾。
根據(jù)發(fā)明實(shí)施例,通過在存儲(chǔ)介質(zhì)中創(chuàng)建用于存儲(chǔ)倒排索引文件的倒排索引文件夾;為倒排索引文件夾設(shè)置閾值,閾值是創(chuàng)建新的倒排索引文件夾的判斷條件;在倒排索引文件夾的屬性超過閾值,創(chuàng)建用于存儲(chǔ)倒排索引文件的新的倒排索引文件夾,解決了由于倒排索引文件夾中倒排索引文件過多導(dǎo)致的該倒排索引文件夾讀取速度過慢的問題,達(dá)到了通過對倒排索引文件夾存儲(chǔ)在多個(gè)倒排索引文件夾中,提高讀取速度的效果。
附圖說明
構(gòu)成本申請的一部分的附圖用來提供對本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
圖1是根據(jù)本發(fā)明實(shí)施例的一種倒排索引文件的存儲(chǔ)方法的流程圖;
圖2是根據(jù)本發(fā)明實(shí)施例優(yōu)選的一種倒排索引文件的存儲(chǔ)方法的流程圖;
圖3是根據(jù)本發(fā)明實(shí)施例優(yōu)選的一種倒排索引文件的存儲(chǔ)方法的流程圖;
圖4是根據(jù)本發(fā)明實(shí)施例優(yōu)選的一種倒排索引文件的存儲(chǔ)方法的流程圖;
圖5是根據(jù)本發(fā)明實(shí)施例的一種倒排索引文件的存儲(chǔ)裝置的示意圖;
圖6是根據(jù)本發(fā)明實(shí)施例優(yōu)選的一種倒排索引文件的存儲(chǔ)裝置的示意圖;
圖7是根據(jù)本發(fā)明實(shí)施例優(yōu)選的一種倒排索引文件的存儲(chǔ)裝置的示意圖;以及
圖8是根據(jù)本發(fā)明實(shí)施例優(yōu)選的一種倒排索引文件的存儲(chǔ)裝置的示意圖;
具體實(shí)施方式
需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410449591.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種紡絲液及其用于制備納米纖維膜的方法
- 下一篇:俯臥位頭面部保護(hù)架
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 動(dòng)態(tài)存儲(chǔ)管理裝置及方法
- 一種存儲(chǔ)方法、服務(wù)器及存儲(chǔ)控制器
- 一種基于存儲(chǔ)系統(tǒng)的控制方法及裝置
- 一種信息的存儲(chǔ)控制方法
- 一種數(shù)據(jù)存儲(chǔ)方法及裝置
- 數(shù)據(jù)存儲(chǔ)方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)存儲(chǔ)控制方法及裝置
- 存儲(chǔ)設(shè)備、存儲(chǔ)系統(tǒng)及存儲(chǔ)方法
- 物料存儲(chǔ)方法及系統(tǒng)
- 基于雙芯智能電表的數(shù)據(jù)分類存儲(chǔ)方法和裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





