[發明專利]一種生成索引文檔ID的方法及裝置在審
| 申請號: | 201510464988.1 | 申請日: | 2015-07-31 |
| 公開(公告)號: | CN105005624A | 公開(公告)日: | 2015-10-28 |
| 發明(設計)人: | 楊乾磊;詹麗 | 申請(專利權)人: | 天脈聚源(北京)傳媒科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京尚倫律師事務所 11477 | 代理人: | 張亮 |
| 地址: | 100007 北京市東城區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 生成 索引 文檔 id 方法 裝置 | ||
1.一種生成索引文檔ID的方法,其特征在于,包括:
接收由客戶端發送來的文件;
存儲所述文件的信息,所述文件的信息分布在至少一個服務器中,每個服務器有至少一個分表;
獲取存儲的所有分表的數量、各個所述分表的序號和循環處理的次數;
根據所述所有分表的數量、所述各個分表的序號和所述循環處理的次數,計算所述文件的索引文檔ID;
所述根據所述所有分表的數量、所述各個分表的序號和所述循環處理的次數,計算所述文件的索引文檔ID,包括:
根據以下公式計算索引文檔ID:
ID=id
其中,符號ID為所述索引文檔ID,符號id
所述符號id
所述文件的索引文檔ID的初始值為0,表示所述文件未被處理。
2.根據權利要求1所述的方法,其特征在于,在生成所述索引文檔ID之前,還包括:
根據哈希算法依此計算所述文件的哈希值;
根據所述哈希值將所述文件匹配到相對應的所述分表。
3.根據權利要求2所述的方法,其特征在于,所述根據所述哈希值將所述文件匹配到相對應的所述分表,包括:
將所述哈希值的整個取值范圍均等的劃分為多個數值區間,所述多個數值區間的數量和所有所述分表的數量相同,且所述數值區間與所述分表一一對應;
將所述文件的哈希值在某一個數值區間段內的所有所述文件,匹配到同一個所述分表。
4.根據權利要求1的方法,其特征在于,還包括:
每個所述分表都擁有各自獨立的所述循環處理的次數。
5.一種生成索引文檔ID的裝置,其特征在于,包括:
接收模塊,用于接收由客戶端發送來的文件;
存儲模塊,用于存儲所述文件的信息,所述文件的信息分布在至少一個服務器中,每個服務器有至少一個分表;
獲取模塊,用于獲取存儲的所有分表的數量、各個所述分表的序號和循環處理的次數;
第一計算模塊,用于根據所述所有分表的數量、所述各個分表的序號和所述循環處理的次數,計算所述文件的索引文檔ID;
所述第一計算模塊,包括:
計算子模塊,用于根據以下公式計算索引文檔ID:
ID=id
其中,符號ID為所述索引文檔ID,符號id
自增子模塊,用于所述符號id
所述文件的索引文檔ID的初始值為0,表示所述文件未被處理。
6.根據權利要求5所述的裝置,其特征在于,還包括:
第二計算模塊,用于在所述第一計算模塊計算所述文件的索引文檔ID之前,根據哈希算法依此計算所述文件的哈希值;
匹配模塊,用于根據所述哈希值將所述文件匹配到相對應的所述分表。
7.根據權利要求6所述的裝置,其特征在于,所述匹配模塊,包括:
劃分子模塊,用于將所述哈希值的整個取值范圍均等的劃分為多個數值區間,所述多個數值區間的數量和所有所述分表的數量相同,且所述數值區間與所述分表一一對應;
匹配子模塊,用于將所述文件的哈希值在某一個數值區間段內的所有所述文件,匹配到同一個所述分表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天脈聚源(北京)傳媒科技有限公司,未經天脈聚源(北京)傳媒科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510464988.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于混合高斯的SDN流聚類方法
- 下一篇:一種訓練數據的處理方法及裝置





