日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種多線程數據上傳方法在審

專利信息
申請號: 201410722793.8 申請日: 2014-12-02
公開(公告)號: CN104408147A 公開(公告)日: 2015-03-11
發明(設計)人: 金洪殿;辛國茂;劉偉;盧軍佐 申請(專利權)人: 浪潮(北京)電子信息產業有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京安信方達知識產權代理有限公司 11262 代理人: 王丹;李丹
地址: 100085 北京市海*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 多線程 數據 上傳 方法
【說明書】:

技術領域

發明涉及信息存儲技術領域,具體涉及一種多線程數據上傳方法。

背景技術

隨著人類社會全面進入信息時代,數據成為與水、石油同等重要的戰略資源。通過挖掘海量數據,能夠使政府和企業的運行決策建立在更加科學的依據基礎上,提高決策效率、危機應對能力和公共服務水平。大數據(big?data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策的資訊。

Hadoop?Distributed?File?System(HDFS)被設計成適合運行在通用硬件(commodity?hardware)上的分布式文件系統。HDFS是一個高度容錯性的系統,適合部署在廉價的機器上。HDFS能提供高吞吐量的數據訪問,非常適合大規模數據集上的應用。運行在HDFS之上的程序有很大量的數據集。典型的HDFS文件大小是TB級別,所以,HDFS被調整成支持大文件,應該提供很高的聚合數據帶寬,一個集群中支持數百個節點,一個集群中還應該支持千萬級別的文件。

HDFS上的文件來源有很多途徑,文件服務器(比如NFS)中的已有文件是一種非常重要的來源。例如,銀行業務系統中從數據庫中卸載的數據表,每天會生成一個增量文件到文件服務器,要對這些文件進行挖掘分析,首先要把其上傳到HDFS中。有些分析可能需要的文件很大。傳統的方法使用單機上傳文件,一方面文件服務器的帶寬沒有充分利用,另一方面HDFS各數據節點沒有被充分利用,所以這種方法用于上傳海量數據往往耗時過久而無法現實應用。因此,需要提出一種新的方案,充分利用文件服務器的帶寬,提高文件上傳效率。

發明內容

本技發明提供了一種多線程數據上傳方法,充分考慮HDFS的特性,充分利用資源(帶寬、磁盤IO等),極大提高了海量數據上傳的效率并保證文件行原子性。所述方法包括:

S1:配置需要上傳的文件所在源路徑信息、文件需要上傳到HDFS系統的目的路徑信息以及可以使用的線程數目信息;

S2:根據所述需要上傳的文件的數據量和配置的所述線程數目信息確定每個線程需要處理的數據范圍;

S3:基于步驟S1配置的所述信息和步驟S2確定的所述數據范圍執行多線程并行數據上傳。

特別地:

所述步驟S2中所述的數據范圍包括每個線程需要上傳的文件數據的開始位置偏移量和結束位置偏移量。

特別地:

所述多線程并行數據上傳具體包括如下步驟:

S31:所述線程首先判斷數據上傳開始位置偏移量是否為0,如果是,則執行步驟S32,否則執行步驟S33;

S32:所述線程將所述開始位置偏移量處到所述結束位置偏移量處的數據上傳到HDFS系統,并執行步驟S34;

S33:所述線程從所述開始位置偏移量處向后依次讀取每一字節數據,直至讀取到的數據為換行符,將所述換行符后到所述結束位置偏移量處的數據上傳到HDFS系統;

S34:從所述結束位置偏移量處向后依次讀取每一字節數據并上傳,直至所讀取到的數據為換行符,流程結束。

本發明的有益效果是:將一個大的文本文件分為多個文件并行上傳到HDFS系統中,從而提高寫入速度,大大降低了文件上傳的時間。

附圖說明

附圖1為本發明提出的多線程數據上傳方法流程圖。

附圖2為本發明提出的基于多線程的保障HDFS文件行原子性的數據上傳方法的流程圖。

具體實施方式

下面將結合附圖詳細描述本發明提出的多線程數據上傳方法,所述方法能夠保障HDFS文件行原子性。

本發明主要考慮可以在保障數據行原子性的基礎上并行的上傳數據,充分利用網絡I/O和系統資源。每個線程上傳的數據量默認為:文件大小/線程總數。每個線程上傳文件開始前,先判斷讀取的開始偏移量第一個字符是否是換行符,如果是不是換行符,則按字節向后讀取,直至讀取到換行符,然后從換行符后開始上傳文件內容,如果開始偏移量為0,則不需要判斷是否是換行符,讀取數據并開始上傳。當線程上傳文件的內容達到分配的內容時,需要繼續判斷結束偏移量后的下一個字符是否是換行符,如不是換行符,則需要繼續上傳,直至最后一個字符是換行符。這就實現了每個線程在上傳文件內容的時候,開始時向后移動,結束時也向后移動,從而保證了文件行原子性。

參見附圖1,本發明提出的多線程數據上傳方法,所述方法包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮(北京)電子信息產業有限公司,未經浪潮(北京)電子信息產業有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410722793.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩精品999| 美女被羞羞网站视频软件| 91性高湖久久久久久久久_久久99| 国产精品无码专区在线观看| 日韩av在线播| 国产日韩欧美亚洲| 热久久国产| 99久久国产免费,99久久国产免费大片 | 国产真实乱偷精品视频免| 激情久久久| 久久久久久久久亚洲精品| 日韩av不卡一区二区| 亚洲国产精品一区二区久久hs| 久久er精品视频| 国产视频1区2区| 中文字幕制服狠久久日韩二区| 26uuu亚洲电影在线观看| 狠狠综合久久av一区二区老牛| 欧美一级特黄乱妇高清视频| 国产精品一区二区三区在线看| 老太脱裤子让老头玩xxxxx| 黄色香港三级三级三级| 国产日产高清欧美一区二区三区| 国产乱人乱精一区二视频国产精品| 久久精品二| 激情久久综合网| 狠狠色噜噜狠狠狠狠2018| 国产乱了高清露脸对白| 国产亚洲另类久久久精品| 狠狠色噜噜狠狠狠狠69| 欧美亚洲国产日韩| **毛片在线免费观看| 国产精品久久久综合久尹人久久9| 久久久精品久久日韩一区综合| 肥大bbwbbwbbw高潮| 午夜国内精品a一区二区桃色| 国产女人和拘做受视频免费| 欧美精品一区二区三区四区在线 | free×性护士vidos欧美| 国产乱码一区二区| 中文字幕一区二区三区乱码视频 | 久久久国产精品一区| 最新国产精品自拍| 中文字幕在线一区二区三区| 国产88av| 亚洲乱亚洲乱妇28p| 久久夜色精品久久噜噜亚| 国产精品一区二区久久乐夜夜嗨| 亚洲精品卡一卡二| 国产精品女同一区二区免费站| 色噜噜狠狠色综合影视| 中文字幕日韩有码| 久久亚洲综合国产精品99麻豆的功能介绍| 亚洲欧美一卡二卡| 性欧美激情日韩精品七区| 国产91免费在线| 欧美日韩一区二区在线播放| 亚洲福利视频一区| 欧美一区二区三区片| 日韩精品中文字幕在线播放| 午夜亚洲国产理论片一二三四| 91久久精品久久国产性色也91| 国产婷婷一区二区三区久久| 欧美激情片一区二区| 国产农村妇女精品一二区| 黄色91在线观看| 亚洲欧美日韩国产综合精品二区| 欧美午夜羞羞羞免费视频app| 精品99在线视频| 欧美在线视频三区| 久久婷婷国产综合一区二区| 国产品久精国精产拍| 岛国精品一区二区| 亚洲麻豆一区| 日韩av一区二区在线播放| 日韩精品一二区| 午夜激情在线播放| 亚洲欧洲精品一区二区三区不卡| 欧美日韩高清一区二区| 国产一区二区播放| 欧美在线一级va免费观看| 国产精品久久久久久久久久久久久久久久久久|