日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]云環境下分布式網絡信息采集方法有效

專利信息
申請號: 201510020854.0 申請日: 2015-01-15
公開(公告)號: CN104699757B 公開(公告)日: 2018-03-13
發明(設計)人: 張登銀;于建坤 申請(專利權)人: 南京郵電大學
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 江蘇愛信律師事務所32241 代理人: 唐小紅
地址: 210003 江蘇*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 環境 分布式 網絡 信息 采集 方法
【說明書】:

技術領域

發明屬于云計算與大數據領域,涉及在云環境下分布式網絡爬蟲系統的模型的設計。

背景技術

互聯網最基礎的功能即提供信息,目前,互聯網上的信息已是海量,搜索引擎則是網民在汪洋中搜尋信息的工具,是互聯網上不可或缺的工具和基礎應用之一。根據《CNNIC:2014年第33次中國互聯網絡發展狀況統計報告》顯示[1],截止2013年12月,我國搜索引擎用戶規模達到4.90億,與2012年底相比增長3856萬人,增長率為8.5%,使用率為79.3%。位列網絡應用中即時通信、網絡新聞之后的第三位。在美國,搜索引擎使用率已經達到了91%,在中國這樣一個網民快速增長和以年輕網民主導的國家,搜索引擎用戶會繼續增長,對于擁有核心技術和海量用戶的搜索引擎行業,發展前景令人看好。

云計算的概念由IBM、Google等IT服務企業提出后一直在不斷推進與深入,云計算的基本特征是資源共享、按需分配、彈性調度和服務可擴展,云計算所提供的強大計算能力和存儲能力能夠支撐爬蟲系統功能的實現。Hadoop是一個由Apache基金會所開發的分布式系統基礎架構,它實現了一個分布式文件系統,簡稱HDFS,為海量的數據提供了存儲。它還提供了一種基于M/R計算模型的開發框架,通過實現這種框架,可以快速地開發出高效、可靠的分布式計算程序。

傳統的分布式網絡爬蟲系統從功能實現的方式上可以分為無中心調度節點的獨立式架構、擁有一個調度中心的動態分配架構以及將整個網絡分成不同的部分分別爬行的靜態分配架構。無中心調度節點的獨立式架構中各個節點之間缺乏交流,造成重復爬行大量的冗余頁面。靜態分配架構中,URL的分配方式是按照爬行頁面的地域特征,指定爬行服務器爬行的IP范圍,沒有考慮到不同地域上頁面的數量,造成不同的爬行服務器上任務分配不均。擁有一個調度中心的動態分配架構可以使URL平均地分配到頁面抓取服務器上,但是沒有考慮到不同服務器上性能的差別。

面對海量的互聯網信息,分布式網絡爬蟲需要做到快速、全面地對網絡信息進行抓取,同時盡可能地達到負載均衡,降低頁面重復率。本文提出一種云環境下的分布式網絡爬蟲系統的設計模型。

發明內容

技術問題:本發明針對傳統網絡爬蟲面對互聯網海量頁面時,頁面抓取速度慢、分布式集群負載不均衡的問題,采用頁面抓取與頁面處理相分離的系統設計方法,提高頁面采集的速度,通過對頁面采集服務器頁面采集時間的橫向和縱向的比較,動態地為頁面采集服務器分配抓取任務,盡可能地使頁面采集服務器達到負載均衡的狀態。

技術方案:本發明的云環境下分布式網絡信息采集方法,含如下步驟:

1)系統模型的組成:頁面信息采集子系統、頁面信息數據處理子系統;

2)頁面信息采集系統創建服務監聽端口,接收中心節點分配的URL集合,當接收到中心節點分配的URL集合后,觸發步驟3;

3)頁面信息采集系統采用異步的方式,對URL集合中的每個頁面進行抓取,抓取完成后,將包含所有頁面信息的結果返回給中心節點;

4)中心節點將接收到的抓取的結果放到待處理頁面集合中,交由云計算平臺對頁面信息進行處理,并且將頁面信息采集服務器加入空閑的服務器列表;

5)云計算平臺提取出頁面中所有的超鏈接,并且對超鏈接進行過濾,將過濾出來的URL放入到待分配的URL集合中;

6)中心節點根據未分配的服務器列表,根據URL分配的策略,將待分配的URL分配給各個頁面信息采集服務器,重復步驟2,直到待分配URL列表為空;

本發明提出了云環境下分布式網絡信息采集方法,通過采用本發明提出的方法,可以在面對互聯網海量的數據時,以最快的速度、最小的頁面重復率抓取網頁信息,并且保證集群主機的負載均衡。

附圖說明

圖1基于本發明的頁面信息抓取流程圖。

圖2是本發明的分布式網絡爬蟲架構圖。

圖3是本發明的頁面采集系統流程圖。

圖4是本發明的URL分配流程圖。

具體實施方式

以下結合附圖對本發明的原理和特征進行描述,所舉實例只用于解釋本發明,并非用于限定本發明的范圍。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201510020854.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品高潮呻吟久| 狠狠色丁香久久婷婷综合_中| 香港三日本三级三级三级| 国产一区二区在线免费| 黄毛片在线观看| 国内揄拍国产精品| 91亚洲国产在人线播放午夜| 国产精品二十区| 国产麻豆精品一区二区| 欧美精品一卡二卡| 亚洲一二三在线| 538国产精品一区二区在线| 色婷婷综合久久久久中文| 国产一区二区在线观看免费| 狠狠色噜噜狠狠狠狠2021天天| 欧美日韩九区| 麻豆91在线| 丝袜美腿诱惑一区二区| 久久久精品欧美一区二区免费| 久久不卡一区| 亚洲乱视频| 少妇中文字幕乱码亚洲影视| 欧美精品免费视频| 午夜国产一区二区三区四区| 亚洲精品久久久久999中文字幕 | 99精品久久99久久久久| 欧美一区二区三区日本| 狠狠色狠狠综合久久| 草逼视频网站| 日韩欧美中文字幕精品| 在线视频国产一区二区| 亚洲国产精品国自产拍久久| 国产精品麻豆一区二区| 最新国产精品自拍| 中文字幕一区二区三区不卡| 性欧美一区二区| www.久久精品视频| 国产二区精品视频| 国产有码aaaae毛片视频| 狠狠色噜噜狠狠狠狠88| 国产亚洲久久| 久久久久久中文字幕| 日韩欧美高清一区| 亚洲国产精品入口| 久久夜靖品2区| 免费久久一级欧美特大黄| 91精品第一页| 91精品视频免费在线观看| 97视频精品一二区ai换脸| 国产九九影院| 思思久久96热在精品国产| 国产精品你懂的在线| 欧美一级久久精品| 精品久久久久99| 欧美精品国产一区| 欧美激情在线观看一区| 国产精品黑色丝袜的老师| 99精品一区| 久久精视频| 亚洲精品主播| 一区二区在线国产| 国产精选一区二区| a级片一区| 国内久久久| 久久精品手机视频| 国产日韩欧美综合在线| 激情欧美日韩| 色就是色欧美亚洲| 欧美系列一区| 精品99在线视频| 亚洲精品一区在线| 欧美一区二区三区在线免费观看 | 欧美激情国产一区| 精品国产91久久久久久久| 国产欧美一区二区在线| 三上悠亚亚洲精品一区二区| 久久影院国产精品| 综合国产一区| 日韩欧美高清一区二区| 久久九精品| 国产.高清,露脸,对白| 国产原创一区二区 | 国产一区二区三区大片| 久久中文一区二区| 日韩午夜电影院| 精品少妇一区二区三区免费观看焕| 欧美一区二区三区四区五区六区| 国产99久久久精品视频| 中文字幕av一区二区三区高| 欧美一区二区伦理片| 91一区二区三区视频| 亚洲欧美一区二区三区不卡| 欧美精品日韩一区| 亚洲乱视频| 国产欧美一区二区精品性色超碰| 欧美日韩亚洲国产一区| 久久一区二区精品| 国产一区二区三级| 午夜666| 亚洲免费永久精品国产| 日韩精品一区二区亚洲 | 国产69精品久久777的优势| 91久久香蕉| 色吊丝av中文字幕| 久99久视频| 亚洲精品国产一区| 欧美精品免费视频| 国产99网站| 大bbw大bbw超大bbw| 欧美日韩国产三区| 欧美一区二区三区精品免费| 婷婷午夜影院| 天天干狠狠插| 在线播放国产一区| 欧美视频1区| 婷婷午夜影院| 天干天干天干夜夜爽av| 国产精华一区二区精华| 亚洲欧美国产日韩色伦| 日韩午夜电影院| 激情欧美日韩| 久久中文一区| 狠狠色丁香久久综合频道| 性欧美1819sex性高播放| 日韩av一区不卡| 久久精品国产久精国产| 日本高清h色视频在线观看| 欧美亚洲视频一区二区| 97久久国产亚洲精品超碰热 | 一区二区91| 精品国产一区二区三区久久久久久| 日韩亚洲欧美一区| 欧美一区二区三区免费视频| 国语对白一区二区| 日韩av在线资源| 中文字幕一区二区三区乱码| 亚洲免费永久精品国产| 自拍偷在线精品自拍偷无码专区 | 午夜大片男女免费观看爽爽爽尤物| 欧美一区免费| 99精品黄色| 久久一区二区三区欧美| 久久久久久久久亚洲精品| 亚洲欧美日韩在线看| av午夜剧场| 国产91丝袜在线熟| 中文字幕欧美久久日高清| 狠狠色丁香久久婷婷综| 久久久久久久国产| 激情aⅴ欧美一区二区三区| 亚洲精品一品区二品区三品区 | 91精品视频一区二区| 91国产在线看| 精品国产乱码久久久久久影片| 国产免费一区二区三区四区| 欧美网站一区二区三区| 午夜影院h| 亚洲欧美一区二区精品久久久| 国产在线不卡一| 欧美日韩激情一区| 91看片app| 国产一区二区电影在线观看| 性生交片免费看片| 亚洲国产精品肉丝袜久久| 日韩精品中文字幕一区二区三区| 日韩欧美高清一区二区| 欧美日韩国产色综合一二三四| 91一区在线观看| 九色国产精品入口| 香港三日三级少妇三级99| 人人玩人人添人人澡97| 香港三日本三级三级三级| 国产主播啪啪| 精品国产免费一区二区三区| 国产精品久久久久久久久久久久久久久久| 中文字幕久久精品一区| 日韩一级片在线免费观看| 国产精品国外精品| av午夜剧场| 久久精品视频一区二区| 午夜激情看片| 亚洲s码欧洲m码在线观看| 一本色道久久综合亚洲精品浪潮| 在线国产精品一区二区| 91一区在线| 国产麻豆91视频| 午夜av在线电影| 十八无遮挡| 国产午夜亚洲精品午夜鲁丝片| 国产视频在线一区二区| 99久久久国产精品免费无卡顿| 91精品国产麻豆国产自产在线| 综合国产一区| 女人被爽到高潮呻吟免费看| 91午夜在线| 日韩一级视频在线| 97国产精品久久| 秋霞三级伦理| 午夜三级大片| 日本免费电影一区二区| 99久久国产免费,99久久国产免费大片 | 97人人模人人爽人人喊小说 | 自拍偷在线精品自拍偷写真图片| 国产高清在线一区| 日韩精品午夜视频| 欧美在线观看视频一区二区| 国产专区一区二区| 91亚洲国产在人线播放午夜| 夜夜夜夜夜猛噜噜噜噜噜gg| 午夜码电影| 精品久久二区| 欧美精品一卡二卡| 国产黄色网址大全| 亚洲日韩欧美综合| 欧美一区二区三区免费播放视频了| 中文字幕区一区二| 亚洲国产视频一区二区三区| 国产三级国产精品国产专区50| 鲁丝一区二区三区免费观看| 国产精品视频一二区| 国产农村妇女精品一二区| 久久福利免费视频| 国产精品视频久久| 亚洲精品久久久久www| 538国产精品一区二区在线| 久久91精品国产91久久久| 扒丝袜网www午夜一区二区三区| 国产精品高潮在线| 亚洲欧洲一二三区| 国产精品国产三级国产专区53| 欧美日韩一区二区三区不卡视频| 不卡在线一区二区| 久久99亚洲精品久久99| 99久久www免费| 日韩av在线免费电影| 一区二区三区日韩精品| 久久人91精品久久久久久不卡| 国产色99| 26uuu亚洲电影在线观看| 欧美一区二区三区在线视频播放| av不卡一区二区三区| 国产欧美亚洲精品第一区软件| 精品国产区| 香港日本韩国三级少妇在线观看 | 久久精品国产精品亚洲红杏| 妖精视频一区二区三区|