[發明專利]一種生成索引文檔ID的方法及裝置在審

申請號：	201510464988.1	申請日：	2015-07-31
公開（公告）號：	CN105005624A	公開（公告）日：	2015-10-28
發明（設計）人：	楊乾磊;詹麗	申請（專利權）人：	天脈聚源(北京)傳媒科技有限公司
主分類號：	G06F17/30	分類號：	G06F17/30
代理公司：	北京尚倫律師事務所 11477	代理人：	張亮
地址：	100007 北京市東城區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種生成索引文檔 id 方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種生成索引文檔ID的方法，其特征在于，包括：

接收由客戶端發送來的文件；

存儲所述文件的信息，所述文件的信息分布在至少一個服務器中，每個服務器有至少一個分表；

獲取存儲的所有分表的數量、各個所述分表的序號和循環處理的次數；

根據所述所有分表的數量、所述各個分表的序號和所述循環處理的次數，計算所述文件的索引文檔ID；

所述根據所述所有分表的數量、所述各個分表的序號和所述循環處理的次數，計算所述文件的索引文檔ID，包括：

根據以下公式計算索引文檔ID：

ID＝idxid×idstep+idflag，

其中,符號ID為所述索引文檔ID，符號idxid為循環處理的次數，符號idstep為所有分表的數量，符號idflag為各個分表的序號；

所述符號idxid在每生產一個索引文檔ID后增加一；

所述文件的索引文檔ID的初始值為0，表示所述文件未被處理。

2.根據權利要求1所述的方法，其特征在于，在生成所述索引文檔ID之前，還包括：

根據哈希算法依此計算所述文件的哈希值；

根據所述哈希值將所述文件匹配到相對應的所述分表。

3.根據權利要求2所述的方法，其特征在于，所述根據所述哈希值將所述文件匹配到相對應的所述分表，包括：

將所述哈希值的整個取值范圍均等的劃分為多個數值區間，所述多個數值區間的數量和所有所述分表的數量相同，且所述數值區間與所述分表一一對應；

將所述文件的哈希值在某一個數值區間段內的所有所述文件，匹配到同一個所述分表。

4.根據權利要求1的方法，其特征在于，還包括：

每個所述分表都擁有各自獨立的所述循環處理的次數。

5.一種生成索引文檔ID的裝置，其特征在于，包括：

接收模塊，用于接收由客戶端發送來的文件；

存儲模塊，用于存儲所述文件的信息，所述文件的信息分布在至少一個服務器中，每個服務器有至少一個分表；

獲取模塊，用于獲取存儲的所有分表的數量、各個所述分表的序號和循環處理的次數；

第一計算模塊，用于根據所述所有分表的數量、所述各個分表的序號和所述循環處理的次數，計算所述文件的索引文檔ID；

所述第一計算模塊，包括：

計算子模塊，用于根據以下公式計算索引文檔ID：

ID＝idxid×idstep+idflag，

其中,符號ID為所述索引文檔ID，符號idxid為循環處理的次數，符號idstep為所有分表的數量，符號idflag為各個分表的序號；

自增子模塊，用于所述符號idxid在每生產一個索引文檔ID后增加一；

所述文件的索引文檔ID的初始值為0，表示所述文件未被處理。

6.根據權利要求5所述的裝置，其特征在于，還包括：

第二計算模塊，用于在所述第一計算模塊計算所述文件的索引文檔ID之前，根據哈希算法依此計算所述文件的哈希值；

匹配模塊，用于根據所述哈希值將所述文件匹配到相對應的所述分表。

7.根據權利要求6所述的裝置，其特征在于，所述匹配模塊，包括：

劃分子模塊，用于將所述哈希值的整個取值范圍均等的劃分為多個數值區間，所述多個數值區間的數量和所有所述分表的數量相同，且所述數值區間與所述分表一一對應；

匹配子模塊，用于將所述文件的哈希值在某一個數值區間段內的所有所述文件，匹配到同一個所述分表。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于天脈聚源(北京)傳媒科技有限公司，未經天脈聚源(北京)傳媒科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201510464988.1/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種基于混合高斯的SDN流聚類方法
下一篇：一種訓練數據的處理方法及裝置

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理
G06F17-00 特別適用于特定功能的數字計算設備或數據處理設備或數據處理方法
G06F17-10 .復雜數學運算的
G06F17-20 .處理自然語言數據的
G06F17-30 .信息檢索；及其數據庫結構
G06F17-40 .數據的獲取和記錄
G06F17-50 .計算機輔助設計

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】