[發(fā)明專利]一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201410090641.0 | 申請(qǐng)日: | 2014-03-12 |
| 公開(公告)號(hào): | CN104915352B | 公開(公告)日: | 2018-10-02 |
| 發(fā)明(設(shè)計(jì))人: | 王立 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 黨曉林 |
| 地址: | 英屬開曼*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 驗(yàn)證 mapreduce 環(huán)境 處理 數(shù)據(jù) 正確性 方法 裝置 | ||
1.一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的方法,其特征在于,包括:
為MapReduce源代碼加入劫持代碼,生成帶有劫持代碼的數(shù)據(jù)處理程序;
運(yùn)行所述帶有劫持代碼的數(shù)據(jù)處理程序?qū)斎霐?shù)據(jù)進(jìn)行數(shù)據(jù)處理,所述帶有劫持代碼的數(shù)據(jù)處理程序劫持得到輸入數(shù)據(jù)、輸出數(shù)據(jù),所述數(shù)據(jù)處理程序記錄數(shù)據(jù)處理過程中代碼是否被執(zhí)行的覆蓋信息;設(shè)定覆蓋信息和對(duì)應(yīng)的輸入數(shù)據(jù)、輸出數(shù)據(jù)為三元組數(shù)據(jù);所述帶有劫持代碼的數(shù)據(jù)處理程序處理的輸入數(shù)據(jù)為真實(shí)數(shù)據(jù);
去除覆蓋信息相同的三元組數(shù)據(jù),形成監(jiān)控三元組集合;
在驗(yàn)證處理數(shù)據(jù)正確性時(shí),將所述監(jiān)控三元組集合中的輸入數(shù)據(jù)返回至帶有劫持代碼的數(shù)據(jù)處理程序重新進(jìn)行數(shù)據(jù)處理,所述帶有劫持代碼的數(shù)據(jù)處理程序劫持得到輸出數(shù)據(jù),形成輸出數(shù)據(jù)集合;
通過監(jiān)控三元組集合中的輸出數(shù)據(jù)驗(yàn)證所述輸出數(shù)據(jù)集合中的數(shù)據(jù)是否正確。
2.如權(quán)利要求1所述的一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的方法,其特征在于,所述劫持代碼包括:輸入劫持代碼和輸出劫持代碼。
3.如權(quán)利要求1所述的一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的方法,其特征在于,所述去除覆蓋信息相同的三元組數(shù)據(jù),形成監(jiān)控三元組集合,具體包括:設(shè)置三元組集合,所述三元組集合的初始狀態(tài)為空集;將新生成的三元組數(shù)據(jù)的覆蓋信息與三元組集合中的三元組數(shù)據(jù)的覆蓋信息進(jìn)行比對(duì),將覆蓋信息不完全相同的三元組數(shù)據(jù)存放至所述三元組集合中,將輸入數(shù)據(jù)處理完畢后所述的三元組數(shù)據(jù)集合作為監(jiān)控三元組集合。
4.如權(quán)利要求1所述的一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的方法,其特征在于,通過監(jiān)控三元組集合中的輸出數(shù)據(jù)驗(yàn)證所述輸出數(shù)據(jù)集合中的數(shù)據(jù)是否正確,具體包括:
將輸出數(shù)據(jù)集合中的每一條輸出數(shù)據(jù)與監(jiān)控三元組集合中對(duì)應(yīng)的輸出數(shù)據(jù)進(jìn)行比對(duì),且:
對(duì)于同一輸入數(shù)據(jù)的兩個(gè)集合中對(duì)應(yīng)的輸出數(shù)據(jù)相同的,驗(yàn)證輸出數(shù)據(jù)集合中該條數(shù)據(jù)為正確;
對(duì)于同一輸入數(shù)據(jù)的兩個(gè)集合中對(duì)應(yīng)的輸出數(shù)據(jù)不相同的,驗(yàn)證輸出數(shù)據(jù)集合中該條數(shù)據(jù)為錯(cuò)誤。
5.如權(quán)利要求1所述的一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的方法,其特征在于,所述設(shè)定覆蓋信息和對(duì)應(yīng)的輸入數(shù)據(jù)、輸出數(shù)據(jù)為三元組數(shù)據(jù),包括:將標(biāo)識(shí)相同的輸入數(shù)據(jù)與輸出數(shù)據(jù)及對(duì)應(yīng)的覆蓋信息為三元組數(shù)據(jù)。
6.如權(quán)利要求1所述的一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的方法,其特征在于,所述覆蓋信息,包括:語句執(zhí)行覆蓋信息和跳轉(zhuǎn)執(zhí)行覆蓋信息。
7.一種驗(yàn)證MapReduce環(huán)境下處理數(shù)據(jù)正確性的裝置,其特征在于,包括:處理程序準(zhǔn)備單元、三元組生成單元、監(jiān)控三元組集合單元、輸出數(shù)據(jù)集合單元、驗(yàn)證單元;其中,
所述處理程序準(zhǔn)備單元,用于為MapReduce源代碼加入劫持代碼,并生成帶有劫持代碼的數(shù)據(jù)處理程序;
所述三元組生成單元,用于運(yùn)行所述處理程序準(zhǔn)備單元中的數(shù)據(jù)處理程序?qū)斎霐?shù)據(jù)進(jìn)行數(shù)據(jù)處理,并記錄輸入數(shù)據(jù)、輸出數(shù)據(jù)和覆蓋信息,將覆蓋信息和對(duì)應(yīng)的輸入數(shù)據(jù)、輸出數(shù)據(jù)設(shè)定為三元組數(shù)據(jù);所述帶有劫持代碼的數(shù)據(jù)處理程序處理的輸入數(shù)據(jù)為真實(shí)數(shù)據(jù);
所述監(jiān)控三元組集合單元,用于讀取所述三元組生成單元生成的三元組數(shù)據(jù),去除覆蓋信息相同的三元組數(shù)據(jù),形成監(jiān)控三元組集合;
所述輸出數(shù)據(jù)集合單元,用于在驗(yàn)證處理數(shù)據(jù)正確性時(shí),將所述監(jiān)控三元組集合中的輸入數(shù)據(jù)返回至三元組生成單元進(jìn)行數(shù)據(jù)處理,并將此時(shí)的輸出數(shù)據(jù)存放至輸出數(shù)據(jù)集合中;
所述驗(yàn)證單元,用于根據(jù)監(jiān)控三元組集合中的輸出數(shù)據(jù),驗(yàn)證輸出數(shù)據(jù)集合中的輸出數(shù)據(jù)是否正確。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410090641.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 驗(yàn)證系統(tǒng)、驗(yàn)證服務(wù)器、驗(yàn)證方法、驗(yàn)證程序、終端、驗(yàn)證請(qǐng)求方法、驗(yàn)證請(qǐng)求程序和存儲(chǔ)媒體
- 驗(yàn)證目標(biāo)系統(tǒng)的驗(yàn)證系統(tǒng)及其驗(yàn)證方法
- 驗(yàn)證設(shè)備、驗(yàn)證方法和驗(yàn)證程序
- 驗(yàn)證裝置、驗(yàn)證系統(tǒng)以及驗(yàn)證方法
- 驗(yàn)證方法、驗(yàn)證系統(tǒng)、驗(yàn)證設(shè)備及其程序
- 驗(yàn)證方法、用于驗(yàn)證的系統(tǒng)、驗(yàn)證碼系統(tǒng)以及驗(yàn)證裝置
- 圖片驗(yàn)證碼驗(yàn)證方法和圖片驗(yàn)證碼驗(yàn)證裝置
- 驗(yàn)證裝置、驗(yàn)證程序和驗(yàn)證方法
- 驗(yàn)證裝置、驗(yàn)證方法及驗(yàn)證程序
- 跨多個(gè)驗(yàn)證域的驗(yàn)證系統(tǒng)、驗(yàn)證方法、驗(yàn)證設(shè)備
- 一種處理串行任務(wù)的數(shù)據(jù)處理裝置及方法
- 一種將MapReduce轉(zhuǎn)換為SQL的方法和裝置
- 一種基于MapReduce的數(shù)據(jù)處理方法和裝置
- MapReduce應(yīng)用的相關(guān)參數(shù)的配置方法和裝置
- MapReduce作業(yè)處理系統(tǒng)、服務(wù)器及處理方法
- 一種考慮任務(wù)相關(guān)性的Hive優(yōu)化方法及系統(tǒng)
- 一種運(yùn)行MapReduce作業(yè)的方法、裝置及系統(tǒng)
- 一種數(shù)據(jù)查詢的優(yōu)化方法和裝置
- 一種Sqoop集成多版本HBase的方法及裝置
- 一種計(jì)算HiveSql執(zhí)行進(jìn)度的方法
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)終端和環(huán)境檢測(cè)系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動(dòng)力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)儀(環(huán)境貓)





