[發明專利]一種條目提取方法和裝置有效
申請號: | 201611128511.7 | 申請日: | 2016-12-09 |
公開(公告)號: | CN106777042B | 公開(公告)日: | 2019-10-18 |
發明(設計)人: | 劉京洋 | 申請(專利權)人: | 廣州華多網絡科技有限公司 |
主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 校麗麗 |
地址: | 511449 廣東省廣州市番*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 條目 提取 方法 裝置 | ||
本發明公開了一種條目提取方法和裝置,屬于信息技術領域,以在獲取訪問頻率高的條目的過程中節省存儲空間。所述方法包括:從第一個采樣周期開始直到最后一個采樣周期的前一個采樣周期,執行以下步驟:a.獲取當前采樣周期內對各個條目的訪問次數;b.根據所述當前采樣周期內對各個條目的訪問次數,確定所述當前采樣周期內條目訪問的平均值;c.移除所述當前采樣周期內訪問次數小于所述平均值的條目,并將訪問次數不小于所述平均值的條目作為下一采樣周期內的條目;重復步驟a~c,直到下一采樣周期為最后一個采樣周期;當下一采樣周期為最后一個采樣周期時,按照訪問次數從高到低的順序提取最后一個采樣周期中的指定個條目。本發明用于條目提取。
技術領域
本發明涉及信息技術領域,特別涉及一種條目提取方法和裝置。
背景技術
在大規模表存儲結構中,經常需要獲取訪問頻率高的一些條目,例如,最經常訪問的前8個條目,以對條目進行分析和進行控制操作。
相關技術中,為獲取訪問頻率最高的一些條目,通常為每一個條目增加一個計數器和一個初始計數記錄,在指定的時間后觀察統計每一個條目的初始計數與當前計數之間的計數差值,進行排序后取得訪問頻率最高的前N(例如,10個)個條目。
但是,這種獲取訪問頻率高的條目的方法會耗費極大的存儲空間。
發明內容
為了解決現有技術的問題,本發明實施例提供了一種條目提取方法和裝置,以在獲取訪問頻率高的條目的過程中節省存儲空間。
一方面,提供一種條目提取方法,其特征在于,所述方法包括:
從第一個采樣周期開始直到最后一個采樣周期的前一個采樣周期,執行以下步驟:
a.獲取當前采樣周期內對各個條目的訪問次數;
b.根據所述當前采樣周期內對各個條目的訪問次數,確定所述當前采樣周期內條目訪問的平均值;
c.移除所述當前采樣周期內訪問次數小于所述平均值的條目,并將訪問次數不小于所述平均值的條目作為下一采樣周期內的條目;
d.確定下一采樣周期是否為最后一個采樣周期;
若下一采樣周期不為最后一個采樣周期,重復步驟a~d,直到下一采樣周期為最后一個采樣周期;
當下一采樣周期為最后一個采樣周期時,按照訪問次數從高到低的順序提取最后一個采樣周期中的指定個條目。
可選地,在一個實施例中,所述方法還包括:
確定提取的所述指定個條目中的各個條目的訪問次數是否超過閾值;
將提取的所述指定個條目中超過閾值的條目封鎖指定時間。
可選地,在另一個實施例中,在步驟c之后,所述方法還包括:
針對當前采樣周期,確定訪問次數不小于所述平均值的條目中的各個條目的訪問次數是否超過閾值;
將訪問次數超過閾值的條目進行封鎖。
可選地,在另一個實施例中,所述方法還包括:
當封鎖的條目數目達到指定的條目數目的情況下,對于后續各個采樣周期,將后續各個采樣周期內需要封鎖的條目進行封鎖,同時將已封鎖的條目中的至少一個條目進行解封鎖;
其中,封鎖的條目數目等于解封鎖的條目數目;
其中,所述需要封鎖的條目為訪問次數超過所述閾值的條目。
可選地,在另一個實施例中,所述將后續各個采樣周期內需要封鎖的條目進行封鎖,同時將已封鎖的條目中的至少一個條目進行解封鎖包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州華多網絡科技有限公司,未經廣州華多網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611128511.7/2.html,轉載請聲明來源鉆瓜專利網。