日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于垂直行業的多任務式采集與收割方法在審

專利信息
申請號: 201410774655.4 申請日: 2014-12-16
公開(公告)號: CN104391990A 公開(公告)日: 2015-03-04
發明(設計)人: 王詩華;王傳超;孫海峰 申請(專利權)人: 浪潮軟件集團有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 濟南信達專利事務所有限公司 37100 代理人: 姜明
地址: 250100 山東*** 國省代碼: 山東;37
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 垂直 行業 任務 采集 收割 方法
【說明書】:

技術領域

本發明涉及一種計算機應用,?涉及行業垂直搜索采集、分布式計算與存儲技術領域,具體地說是一種基于垂直行業的多任務式采集與收割方法。

背景技術

當今已經是數據大爆炸的時代,各個行業面臨著大部分的問題如下:

1、集中管理互聯網垂直行業數據。從無規則、無行業分類的互聯網獲取到針對性的行業價值的信息;

2、主流的Nutch等很難原生的滿足多任務,并且定制采集和加工數據的需求,同時還需要解決大型互聯網公司的反爬機制;

3、采集到的互聯網數據如何自動收割和語義化存儲,并與內部數據做共享與整合;?

4、海量數據的存儲,快速讀寫與容災;

5、集群管理維護難。原有系統沒有一個從硬件到軟件到服務狀態的整體監控和管理系統。

發明內容

本發明的目的是基于“自定義的主從式、多任務采集和收割”將客戶定義的一個垂直行業業務需求,進行智能的匹配采集源和數據元素;將定義好的一個需求主題經過本專利的gReap系統進行多任務化為任務集合,集合中任意一個任務可再按維度細化成子任務,按照主從心跳模式由調度節點分配給執行節點執行采集,對于執行完采集的節點,調度節點主動進行收割,采取分布式存儲,并與行業內部組織數據進行整合分析的技術。

本發明的目的是按以下方式實現的,具體步驟如下:

步驟1:客戶根據需求主題,通過某些或者某類行業網站,分析并定義出所需的數據要素,發送給本專利的gReap采割系統;

步驟2:gReap采割系統根據請求數據,自動匹配行業模板及其采割方法,并回饋給客戶以驗證是否符合要求,如果不符合,提供給用戶自定義數據模型和采割方法,以便gReap按需提供實現數據和內容的交付;

步驟3:確定任務模板,gReap系統中的適配模塊首先接收到這個模板,將模板分解為多個采集任務,并將每個任務分配給調度監控集群;

步驟4:調度節點根據任務進行按維度劃分,并負責將各個子任務分配給執行節點,同時監控執行情況,對于異常或者出錯的子任務動態遷移到正常執行節點,調度節點與執行節點依賴MapReduce計算模型;

步驟5:執行節點融合Nutch思路,按獨立網址維護采集周期,并納入gReap語義化采集模塊進行采集,該模塊用以解決主要反爬宿主的數據采集;

步驟6:在執行完成采集以后,執行節點主動心跳狀態,gReap系統收割模塊負責異構收割,并按照一定的規則進行數據預處理,并進行收割庫歸檔,以備后續數據分析;

步驟7:收割庫的歸檔借助于Hadoop分布式文件系統,采用列式數據分布存儲方式,以提供海量存儲和高性能的讀寫速度,以及安全的容災能力。

本發明的目的有益效果是:該方法用以填補市面主流搜索采集及其數據匯總技術的部分短板。解決了垂直行業關于多源化、互異化數據采集中多任務定制與協同困難,定制化解析語義不強,無法智慧化數據并及時收割等難題。通過實現該方法的互聯網行業數據采集,再疊加政府企業內部組織數據以融合大數據,讓我們透過數據背后分析出市場價值與趨勢。

附圖說明

圖1為gReap系統的整體核心流程圖。

具體實施方式

參照說明書附圖對本發明的方法作以下詳細地說明。

提供一種基于垂直行業的多任務式采集與收割方法,具體步驟如下:

步驟1:客戶根據需求主題,通過某些或者某類行業網站,分析并定義出所需的數據要素,發送給本專利的gReap采割系統;

步驟2:gReap采割系統根據請求數據,自動匹配行業模板及其采割方法,并回饋給客戶以驗證是否符合要求,如果不符合,提供給用戶自定義數據模型和采割方法,以便gReap按需提供實現數據和內容的交付;

步驟3:確定任務模板,gReap系統中的適配模塊首先接收到這個模板,將模板分解為多個采集任務,并將每個任務分配給調度監控集群;

步驟4:調度節點根據任務進行按維度劃分,并負責將各個子任務分配給執行節點,同時監控執行情況,對于異常或者出錯的子任務動態遷移到正常執行節點,調度節點與執行節點依賴MapReduce計算模型;

步驟5:執行節點融合Nutch思路,按獨立網址維護采集周期,并納入gReap語義化采集模塊進行采集,該模塊用以解決主要反爬宿主的數據采集;

步驟6:在執行完成采集以后,執行節點主動心跳狀態,gReap系統收割模塊負責異構收割,并按照一定的規則進行數據預處理,并進行收割庫歸檔,以備后續數據分析;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件集團有限公司,未經浪潮軟件集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410774655.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一级大片| 99精品视频一区二区| 午夜天堂在线| 鲁丝一区二区三区免费观看| 亚洲国产精品一区在线观看| 国产精品偷伦一区二区| 狠狠色综合久久丁香婷婷| 波多野结衣巨乳女教师| 老太脱裤子让老头玩xxxxx| 欧美日韩中文国产一区发布| 久久国产精品波多野结衣| 欧美乱妇在线视频播放| 午夜av资源| 久久精品一二三四| 7777久久久国产精品| 国产精品视频99| 国产精品日韩一区二区三区| 日本高清二区| 夜色av网| 久久99精| 理论片高清免费理伦片| 亚洲国产精品一区在线| 久久99精品久久久秒播| 亚洲精品卡一卡二| 欧美精品日韩一区| 国产精品一二三区视频网站| 精品少妇一区二区三区| 搡少妇在线视频中文字幕| 久免费看少妇高潮a级特黄按摩| 性欧美精品动漫| 国产毛片精品一区二区| 国产一级片大全| 午夜av在线电影| 午夜伦理片在线观看| 精品国产免费久久| 亚洲欧美一区二区三区1000| 97人人模人人爽人人喊小说| 久久精品国产色蜜蜜麻豆| 国产欧美日韩二区| 97久久精品人人做人人爽| 88888888国产一区二区| 99视频国产精品| 99国产精品久久久久老师| 亚洲乱子伦| 中文天堂在线一区| 国产欧美日韩中文字幕| 午夜激情看片| 欧美xxxxhdvideos| 欧美国产三区| 亚洲精品一区在线| 国产精品一区二区av日韩在线| 在线观看欧美日韩国产| 国产精品欧美日韩在线| 国产女人和拘做受在线视频| 午夜一级免费电影| 狠狠色综合久久婷婷色天使| 欧美一区二区三区艳史| 日韩精品一区二区中文字幕| 国产在线一区二区视频| 国产麻豆一区二区| 中文字幕一二三四五区| 中文字幕一区二区三区不卡| 99精品久久久久久久婷婷| 亚洲国产精品综合| 国产区精品| 久久婷婷国产麻豆91天堂徐州| 午夜wwwww| 曰韩av在线| 夜夜嗨av一区二区三区中文字幕 | 色综合久久88| 国产69精品福利视频| 久久激情图片| 午夜激情看片| 日韩欧美精品一区二区| 久久国产精久久精产国| 国产一区二区麻豆| 日韩av在线电影网| 国产欧美日韩在线观看| 国产偷久久一区精品69| 欧美日韩一区二区三区四区五区 | 亚洲区在线| 日韩区欧美久久久无人区| 91久久国产露脸精品| 欧美精品八区| 久久影视一区二区| 99久久国产综合精品女不卡| 午夜av在线电影| 国产精品久久久爽爽爽麻豆色哟哟| 国产精品国产三级国产专区51区| 国产一区2区3区| 欧美日韩一区二区三区精品| 香港日本韩国三级少妇在线观看| 狠狠色丁香久久综合频道| 国产欧美一区二区三区不卡高清| 国产女性无套免费看网站 | 亚洲欧美色图在线| 在线观看欧美一区二区三区| 99re热精品视频国产免费| 中文字幕欧美久久日高清| 国产不卡一二三区| 久久精视频| 国产1区2区3区中文字幕| 亚洲欧美日韩视频一区| 久久国产免费视频| 欧美精品乱码视频一二专区| 女人被爽到高潮呻吟免费看 | 国产极品一区二区三区| 国产日韩欧美在线影视| 大bbw大bbw巨大bbw看看| 一区二区在线不卡| 991本久久精品久久久久| 日本三级韩国三级国产三级| 日韩精品一区二区三区在线 | 国产丝袜一区二区三区免费视频| 99久久精品一区| 免费午夜在线视频| 日本一二三四区视频| 日本一区二区三区中文字幕| 国产男女乱淫真高清视频免费| 亚洲神马久久| 97视频精品一二区ai换脸| 国产精品一区二区毛茸茸| 最新日韩一区| 99精品国产一区二区三区不卡| 国产午夜一区二区三区| 久久久久偷看国产亚洲87| 欧美性xxxxx极品少妇| 黄色91在线观看| 亚洲精品久久久久久久久久久久久久 | 亚洲精品人| 色综合久久精品| 国产另类一区| 91精品国模一区二区三区| 91区国产| 国产精品久久久久四虎| 91理论片午午伦夜理片久久| 欧美日韩一区二区三区不卡| 久久婷婷国产香蕉| 国产精品一级在线| 国产精品1区二区| 国产婷婷色一区二区三区在线| 久久aⅴ国产欧美74aaa| 国产一区二区大片| 欧美日韩中文字幕一区二区三区 | 午夜影院色| 日韩亚洲精品在线| 国内久久久| 欧美色图视频一区| 国产一区二区三区中文字幕| 91一区二区在线观看| 亚洲一级中文字幕| 亚洲区在线| 97视频精品一二区ai换脸| 91偷拍网站| 欧美国产一区二区在线| 欧美亚洲视频二区| 欧美中文字幕一区二区三区| 久久精品一二三| 亚洲无人区码一码二码三码 | 亚洲欧美日韩三区| 国产欧美精品va在线观看| 日韩毛片一区| 国产目拍亚洲精品区一区| 理论片午午伦夜理片在线播放| 狠狠色噜噜狠狠狠狠色综合久老司机| 国产日产精品一区二区| 亚洲精品国产setv| 九一国产精品| 精品中文久久| 欧美激情精品久久久久久免费| 日日狠狠久久8888偷色| 素人av在线| 亚洲国产视频一区二区三区| 国产麻豆精品一区二区| 久久一二区| 日韩精品999| 国产麻豆精品一区二区| 国产伦高清一区二区三区| 欧美3p激情一区二区三区猛视频 | 在线国产一区二区三区| 视频一区二区三区欧美| 91麻豆精品国产91久久久无限制版| 欧美一区视频观看| 少妇厨房与子伦在线观看| 国产精品区一区二区三| 国产精品伦一区二区三区视频| 国产精品久久免费视频| 欧美日韩亚洲另类| 国产高清一区二区在线观看| 亚洲高清久久久| 99精品黄色| 国产二区三区视频| 午夜精品在线播放| 91精品一区二区在线观看 | 精品久久久久久久免费看女人毛片| 国产精品一区二区在线观看| 久久影院一区二区| 99热久久精品免费精品| 欧美日韩国产一区在线| 午夜电影一区二区| 日韩精品中文字| 99精品国产免费久久| 国产精品一区一区三区| 国产日本一区二区三区| 销魂美女一区二区| 国产精品电影一区二区三区| 亚洲色欲色欲www| 91精品一区二区中文字幕| 中文无码热在线视频| 十八无遮挡| 国产精品国精产品一二三区| 91精品视频一区二区| 国产乱一区二区三区视频| 亚洲国产精品肉丝袜久久| 国产精品二区一区二区aⅴ| 麻豆精品国产入口| 国产理论一区二区三区| 国产一区二区91| 欧美日韩国产在线一区| 精品国产仑片一区二区三区| 99国产午夜精品一区二区天美| 久久激情综合网| 精品香蕉一区二区三区| 国产精品久久久久久久久久久不卡| 中文字幕+乱码+中文字幕一区| 欧美在线视频一区二区三区| 日韩av在线导航| 香蕉av一区| 国产乱人乱精一区二视频国产精品| 久久综合二区| 香蕉免费一区二区三区在线观看| 国产原创一区二区 | 国产69精品久久久久999小说| 久久影视一区二区| 午夜看大片| 国产精品亚洲精品| 国产不卡一二三区| 午夜情所理论片| 国产特级淫片免费看| 国产不卡一区在线| 国产欧美视频一区二区三区| 午夜大片男女免费观看爽爽爽尤物| 四虎久久精品国产亚洲av| 日韩亚洲欧美一区二区| www.久久精品视频| 国产精品久久久久久久四虎电影|