[發(fā)明專利]數(shù)據(jù)抽取方法、裝置、電子設備及計算機可讀存儲介質有效
| 申請?zhí)枺?/td> | 201810247760.0 | 申請日: | 2018-03-23 |
| 公開(公告)號: | CN108399266B | 公開(公告)日: | 2022-01-07 |
| 發(fā)明(設計)人: | 林萬琪 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25;G06F16/22 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 唐麗 |
| 地址: | 310052 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù) 抽取 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
1.一種數(shù)據(jù)抽取方法,應用于存儲有多個待抽取數(shù)據(jù)的電子設備,每個所述待抽取數(shù)據(jù)對應一索引,其特征在于,所述數(shù)據(jù)抽取方法包括:
根據(jù)獲取的起始索引,生成索引查找區(qū)間;
從所述索引查找區(qū)間中獲取一目標索引;
抽取與所述目標索引對應的所述待抽取數(shù)據(jù)作為抽中數(shù)據(jù);
當所述抽中數(shù)據(jù)的數(shù)量未滿足預設數(shù)量時,依據(jù)所述目標索引重新確定所述索引查找區(qū)間;
其中,所述根據(jù)獲取的起始索引,生成索引查找區(qū)間的步驟包括:
確定終止索引,其中,所述確定終止索引的步驟包括:
獲取第一參數(shù)及第二參數(shù),其中所述第一參數(shù)與可抽取的數(shù)據(jù)的個數(shù)對應,所述第二參數(shù)與當前需抽取的數(shù)據(jù)個數(shù)對應;其中所述可抽取的數(shù)據(jù)不大于所述待抽取數(shù)據(jù)的個數(shù);根據(jù)所述第一參數(shù)及第二參數(shù),確定所述索引查找區(qū)間的終止索引;
根據(jù)所述起始索引和所述終止索引,生成索引查找區(qū)間。
2.如權利要求1所述的數(shù)據(jù)抽取方法,其特征在于,所述根據(jù)所述第一參數(shù)及第二參數(shù),確定所述索引查找區(qū)間的終止索引的步驟包括:
當?shù)谝淮芜M行數(shù)據(jù)抽取且所述第一參數(shù)和第二參數(shù)之間滿足sum≤log2left時,根據(jù)所述待抽取數(shù)據(jù)的個數(shù)、第二參數(shù)及默認值,確定所述索引查找區(qū)間的終止索引;其中,所述sum代表第二參數(shù),所述left代表第一參數(shù);
當不是第一次進行數(shù)據(jù)抽取且所述第一參數(shù)和第二參數(shù)之間滿足sum≤log2left時,根據(jù)所述待抽取數(shù)據(jù)的個數(shù)、第二參數(shù)及前一次數(shù)據(jù)抽取時獲取的所述目標索引,確定所述索引查找區(qū)間的終止索引。
3.如權利要求1所述的數(shù)據(jù)抽取方法,其特征在于,所述根據(jù)所述第一參數(shù)及第二參數(shù),確定所述索引查找區(qū)間的終止索引的步驟包括:
當所述第一參數(shù)和第二參數(shù)滿足sum>log2left時,根據(jù)所述起始索引、第一參數(shù)及第二參數(shù),確定所述索引查找區(qū)間的終止索引,其中,所述sum代表第二參數(shù),所述left代表第一參數(shù)。
4.如權利要求1所述的數(shù)據(jù)抽取方法,其特征在于,所述從所述索引查找區(qū)間中獲取一目標索引的步驟包括:
生成一隨機數(shù);
根據(jù)所述隨機數(shù)、所述索引查找區(qū)間對應的所述起始索引及所述終止索引,計算所述目標索引。
5.如權利要求1所述的數(shù)據(jù)抽取方法,其特征在于,所述數(shù)據(jù)抽取方法還包括:
從重新確定的索引查找區(qū)間中獲取一目標索引;
根據(jù)從所述重新確定的索引查找區(qū)間中獲取的目標索引,抽取對應的所述待抽取數(shù)據(jù)作為所述抽中數(shù)據(jù);
重復依據(jù)從所述重新確定的索引查找區(qū)間中獲取的目標索引確定所述索引查找區(qū)間,直至所述抽中數(shù)據(jù)的數(shù)量滿足預設數(shù)量。
6.一種數(shù)據(jù)抽取裝置,應用于存儲有多個待抽取數(shù)據(jù)的電子設備,每個所述待抽取數(shù)據(jù)對應一索引,其特征在于,所述數(shù)據(jù)抽取裝置包括:
生成模塊,用于根據(jù)獲取的起始索引,生成索引查找區(qū)間;
獲取模塊,用于從所述索引查找區(qū)間中獲取一目標索引;
抽取模塊,用于抽取與所述目標索引對應的所述待抽取數(shù)據(jù)作為抽中數(shù)據(jù);
所述生成模塊,還用于當所述抽中數(shù)據(jù)的數(shù)量未滿足預設數(shù)量時,依據(jù)所述目標索引重新確定所述索引查找區(qū)間;
其中,所述生成模塊包括:
確定子模塊,用于確定終止索引,其中,所述確定子模塊執(zhí)行確定終止索引的方式包括:獲取第一參數(shù)及第二參數(shù),其中所述第一參數(shù)與可抽取的數(shù)據(jù)的個數(shù)對應,所述第二參數(shù)與當前需抽取的數(shù)據(jù)個數(shù)對應;其中所述可抽取的數(shù)據(jù)不大于所述待抽取數(shù)據(jù)的個數(shù);根據(jù)所述第一參數(shù)及第二參數(shù),確定所述索引查找區(qū)間的終止索引;
生成子模塊,用于根據(jù)所述起始索引和所述終止索引,生成索引查找區(qū)間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經(jīng)阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810247760.0/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





