[發(fā)明專利]高效遍歷較大數(shù)據(jù)量集合的方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910734331.0 | 申請(qǐng)日: | 2019-08-09 |
| 公開(kāi)(公告)號(hào): | CN110554917A | 公開(kāi)(公告)日: | 2019-12-10 |
| 發(fā)明(設(shè)計(jì))人: | 馮立曉 | 申請(qǐng)(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號(hào): | G06F9/50 | 分類號(hào): | G06F9/50;G06F9/48;G06F16/24 |
| 代理公司: | 37205 濟(jì)南舜源專利事務(wù)所有限公司 | 代理人: | 劉雪萍 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 子線程 集合 大數(shù)據(jù) 子集合 常規(guī)應(yīng)用程序 較大數(shù)據(jù)量 存儲(chǔ)介質(zhì) 計(jì)算資源 快速處理 唯一對(duì)應(yīng) 主線程 遍歷 服務(wù)器 終端 采集 輸出 合并 創(chuàng)建 | ||
本發(fā)明提供一種高效遍歷較大數(shù)據(jù)量集合的方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì),獲取當(dāng)前服務(wù)器CPU核心數(shù)量;根據(jù)所述CPU核心數(shù)量將大數(shù)據(jù)集合平均拆分為同等數(shù)量的子集合;為每個(gè)子集合創(chuàng)建唯一對(duì)應(yīng)的子線程,控制所述子線程執(zhí)行對(duì)應(yīng)子集合的處理任務(wù);采集所有子線程的計(jì)算結(jié)果,將所有計(jì)算結(jié)果合并后輸出至主線程。本發(fā)明能夠快速處理大數(shù)據(jù)集合,且處理步驟簡(jiǎn)單,能夠充分利用計(jì)算資源,適用于常規(guī)應(yīng)用程序。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種高效遍歷較大數(shù)據(jù)量集合的方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)。
背景技術(shù)
目前,軟件程序?qū)崿F(xiàn)中,經(jīng)常遇到需要處理較大數(shù)據(jù)量集合的場(chǎng)景,傳統(tǒng)的實(shí)現(xiàn)方法如Java語(yǔ)言中的ArrayList使用for循環(huán)以單線程的方式進(jìn)行遍歷處理,無(wú)法發(fā)揮多核CPU的并發(fā)執(zhí)行優(yōu)勢(shì),導(dǎo)致整個(gè)任務(wù)執(zhí)行效率較低。
大數(shù)據(jù)技術(shù)(如Hadoop)使用了與本案類似的分而治之的方案,將一個(gè)大任務(wù)拆分為多個(gè)小任務(wù),最后將計(jì)算結(jié)果進(jìn)行合并,以完成整個(gè)任務(wù)。但其適用的場(chǎng)景為海量數(shù)據(jù)、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),且應(yīng)用復(fù)雜,在常規(guī)的應(yīng)用程序中難以使用。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的上述不足,本發(fā)明提供一種高效遍歷較大數(shù)據(jù)量集合的方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì),以解決上述技術(shù)問(wèn)題。
第一方面,本發(fā)明提供一種高效遍歷較大數(shù)據(jù)量集合的方法,包括:
獲取當(dāng)前服務(wù)器CPU核心數(shù)量;
根據(jù)所述CPU核心數(shù)量將大數(shù)據(jù)集合平均拆分為同等數(shù)量的子集合;
為每個(gè)子集合創(chuàng)建唯一對(duì)應(yīng)的子線程,控制所述子線程執(zhí)行對(duì)應(yīng)子集合的處理任務(wù);
采集所有子線程的計(jì)算結(jié)果,將所有計(jì)算結(jié)果合并后輸出至主線程。
進(jìn)一步的,所述采集所有子線程的計(jì)算結(jié)果,包括:
獲取所有子線程執(zhí)行進(jìn)度;
若獲取到所有子線程均執(zhí)行完成,則采集所有子線程的計(jì)算結(jié)果;
若獲取到子線程執(zhí)行失敗信息,則返回主線程執(zhí)行失敗提示。
進(jìn)一步的,在采集所有子線程的計(jì)算結(jié)果之前,所述方法還包括:
確定所有子線程執(zhí)行進(jìn)度中存在執(zhí)行完成的子線程,篩選出未執(zhí)行完成的子線程中進(jìn)度最少的子線程作為待均衡子線程;
將待均衡子線程的執(zhí)行任務(wù)均分,并將均分后的執(zhí)行任務(wù)分別下發(fā)至待均衡子線程和所述執(zhí)行完成的子線程。
第二方面,本發(fā)明提供一種高效遍歷較大數(shù)據(jù)量集合的系統(tǒng),包括:
數(shù)量獲取單元,配置用于獲取當(dāng)前服務(wù)器CPU核心數(shù)量;
集合拆分單元,配置用于根據(jù)所述CPU核心數(shù)量將大數(shù)據(jù)集合平均拆分為同等數(shù)量的子集合;
線程創(chuàng)建單元,配置用于為每個(gè)子集合創(chuàng)建唯一對(duì)應(yīng)的子線程,控制所述子線程執(zhí)行對(duì)應(yīng)子集合的處理任務(wù);
結(jié)果輸出單元,配置用于采集所有子線程的計(jì)算結(jié)果,將所有計(jì)算結(jié)果合并后輸出至主線程。
進(jìn)一步的,所述結(jié)果輸出單元包括:
進(jìn)度獲取模塊,配置用于獲取所有子線程執(zhí)行進(jìn)度;
完成判定模塊,配置用于若獲取到所有子線程均執(zhí)行完成,則采集所有子線程的計(jì)算結(jié)果;
失敗提示模塊,配置用于若獲取到子線程執(zhí)行失敗信息,則返回主線程執(zhí)行失敗提示。
進(jìn)一步的,所述系統(tǒng)包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910734331.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于有索引的屏障的硬件調(diào)度的系統(tǒng)和方法
- 后臺(tái)應(yīng)用的喚醒方法及裝置、電子設(shè)備
- 流程引擎的指令調(diào)度方法及裝置
- 一種業(yè)務(wù)子卡管理方法及裝置
- 一種基于CIFS協(xié)議創(chuàng)建小文件的方法及系統(tǒng)
- 無(wú)鎖參考計(jì)數(shù)
- 用于執(zhí)行多線程系統(tǒng)的子線程的方法和多線程系統(tǒng)
- 線程處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種狹窄通道環(huán)境下的并行路徑搜索方法、系統(tǒng)及裝置
- 線程間通信方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于大數(shù)據(jù)平臺(tái)的網(wǎng)絡(luò)安全實(shí)施系統(tǒng)及方法
- 基于事件驅(qū)動(dòng)的智慧城市大數(shù)據(jù)體系及處理方法
- 一種大數(shù)據(jù)應(yīng)用開(kāi)發(fā)的系統(tǒng)及方法
- 家用設(shè)備報(bào)告的生成方法、大數(shù)據(jù)系統(tǒng)和存儲(chǔ)介質(zhì)
- 一種基于計(jì)算機(jī)大數(shù)據(jù)的平臺(tái)架構(gòu)
- 一種大數(shù)據(jù)處理系統(tǒng)
- 面向工業(yè)4.0的時(shí)空大數(shù)據(jù)分布式存儲(chǔ)檢索方法及系統(tǒng)
- 一種聯(lián)網(wǎng)式醫(yī)療大數(shù)據(jù)分級(jí)傳輸方法及系統(tǒng)
- 一種大數(shù)據(jù)信息監(jiān)控方法、裝置及計(jì)算機(jī)設(shè)備
- 一種知識(shí)產(chǎn)權(quán)大數(shù)據(jù)情報(bào)檢索系統(tǒng)
- 多載波數(shù)據(jù)接收方法、多載波調(diào)制裝置及多載波調(diào)制系統(tǒng)
- 多載波調(diào)制接收器的內(nèi)部碼元干擾和載波干擾的消除方法
- 用于變換粒子集合的方法及系統(tǒng)
- 基于單向用戶關(guān)系的專家挖掘方法及挖掘系統(tǒng)
- 用于行動(dòng)通信系統(tǒng)的無(wú)線裝置及其隨機(jī)存取方法
- 一種采樣估計(jì)貨物編號(hào)方法
- 單分子測(cè)序和唯一分子標(biāo)識(shí)符以表征核酸序列
- 一種虛擬化環(huán)境中智能生成網(wǎng)絡(luò)防護(hù)策略的方法和設(shè)備
- 一種對(duì)象選擇方法、裝置、系統(tǒng)及計(jì)算設(shè)備
- 一種確定最大影響程度指標(biāo)的種子集合的方法及裝置





