日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]自適應(yīng)網(wǎng)絡(luò)資源收集系統(tǒng)的構(gòu)建及網(wǎng)絡(luò)資源收集方法在審

專利信息
申請?zhí)枺?/td> 201410155856.6 申請日: 2014-04-18
公開(公告)號: CN103902732A 公開(公告)日: 2014-07-02
發(fā)明(設(shè)計)人: 鄒艷珍;張靈簫 申請(專利權(quán))人: 北京大學(xué)
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京天奇智新知識產(chǎn)權(quán)代理有限公司 11340 代理人: 王海洋
地址: 100080*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 自適應(yīng) 網(wǎng)絡(luò)資源 收集 系統(tǒng) 構(gòu)建 方法
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及一種自適應(yīng)網(wǎng)絡(luò)資源收集系統(tǒng)的構(gòu)建及網(wǎng)絡(luò)資源收集方法,尤其是涉及通用的開源軟件項目相關(guān)的網(wǎng)絡(luò)資源收集系統(tǒng)的構(gòu)建及網(wǎng)絡(luò)資源的收集方法。

背景技術(shù)

開源軟件項目相關(guān)數(shù)據(jù)是計算機軟件研究的主要數(shù)據(jù)來源之一?,F(xiàn)有的開源軟件項目數(shù)據(jù)收集相關(guān)技術(shù)主要有如下兩種:

一是通過編寫單一目的數(shù)據(jù)抓取程序獲取開源軟件項目數(shù)據(jù)。研究人員首先確定所需數(shù)據(jù)在互聯(lián)網(wǎng)上的數(shù)據(jù)源,并且確定數(shù)據(jù)源中數(shù)據(jù)的存儲結(jié)構(gòu)和接口,然后根據(jù)數(shù)據(jù)源提供的數(shù)據(jù)接口針對性的編寫網(wǎng)絡(luò)爬蟲程序來抓取數(shù)據(jù)。

二是利用通用的網(wǎng)頁爬蟲技術(shù)進(jìn)行數(shù)據(jù)抓取?;ヂ?lián)網(wǎng)網(wǎng)頁爬蟲是現(xiàn)代搜索引擎的必備組建之一,相關(guān)技術(shù)較為成熟。網(wǎng)頁爬蟲技術(shù)能夠利用超鏈接便利、收集并下載互聯(lián)網(wǎng)站點中的網(wǎng)頁文件。開源社區(qū)中也有成熟可開源爬蟲項目可供擴展和使用,如Apache開源社區(qū)下的Nutch項目等。

但是,上述開源軟件項目相關(guān)的網(wǎng)絡(luò)資源數(shù)據(jù)收集方法存在以下問題:

(1)擴展性差。研究人員為特定數(shù)據(jù)源構(gòu)建的爬蟲程序往往只能針對特定數(shù)據(jù)源中特定格式的數(shù)據(jù)的,不具備功能上的擴展性,也無法進(jìn)行復(fù)用。而當(dāng)用戶需要擴展實驗數(shù)據(jù)集或者更改數(shù)據(jù)源時,則需要編寫更多的爬蟲程序。由于復(fù)用已有的爬蟲程序存在困難,研究人員在數(shù)據(jù)收集過程中需要付出大量的重復(fù)勞動。

(2)適用范圍有限。通用的網(wǎng)絡(luò)爬蟲程序只能針對網(wǎng)頁或其他文本文件進(jìn)行數(shù)據(jù)收集,不適用于非結(jié)構(gòu)化的開源數(shù)據(jù)。而在軟件項目數(shù)據(jù)收集的過程中,現(xiàn)有的爬蟲程序難以滿足開源軟件項目數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)接口的多樣性。

鑒于以上,由于現(xiàn)有技術(shù)中并不存在一個解決數(shù)據(jù)收集問題可復(fù)用的通用方法,導(dǎo)致研究人員在獲取研究數(shù)據(jù)的過程中耗費大量精力。因此,尋找一種更好的開源軟件項目相關(guān)數(shù)據(jù)的收集方法是很有必要的。

發(fā)明內(nèi)容

本發(fā)明主要是解決現(xiàn)有技術(shù)所存在的擴展性差和適用范圍有限等問題,提供了一種自適應(yīng)的網(wǎng)絡(luò)資源收集方法,該方法能適用于不同數(shù)據(jù)類型的目標(biāo)網(wǎng)絡(luò)資源,適用范圍廣,可擴展性強。

本發(fā)明的上述技術(shù)問題主要是通過下述技術(shù)方案得以解決的:

一種自適應(yīng)的網(wǎng)絡(luò)資源收集系統(tǒng)的構(gòu)建方法,包括:配置一個統(tǒng)一的網(wǎng)絡(luò)資源收集模塊,所述網(wǎng)絡(luò)資源收集模塊包括一個統(tǒng)一的爬蟲分配裝置以及與若干等待調(diào)用的爬蟲執(zhí)行單元,該爬蟲分配裝置包括:

初始單元:為網(wǎng)絡(luò)資源收集準(zhǔn)備必要的存儲空間及系統(tǒng)開銷;

收集單元:具有統(tǒng)一爬蟲程序接口,能根據(jù)目標(biāo)網(wǎng)絡(luò)資源的數(shù)據(jù)類型選擇不同爬蟲程序收集目標(biāo)網(wǎng)絡(luò)資源的數(shù)據(jù);

關(guān)閉單元:在收集裝置收集到所需要的目標(biāo)數(shù)據(jù)后釋放系統(tǒng)開銷以及在收集裝置出現(xiàn)異常時進(jìn)行異常處理;

配置一個爬蟲依賴模塊,該模塊用于配置網(wǎng)絡(luò)資源收集模塊與目標(biāo)網(wǎng)絡(luò)資源之間的依賴關(guān)系;網(wǎng)絡(luò)資源收集模塊能夠通過爬蟲依賴模塊建立的依賴關(guān)系通過爬蟲分配裝置配置相應(yīng)爬蟲執(zhí)行單元執(zhí)行資源收集。

優(yōu)化的,上述的一種自適應(yīng)的網(wǎng)絡(luò)資源收集方法,初始單元用于爬蟲程序在信息抓取之前進(jìn)行的預(yù)處理過程,包括以下子步驟:

步驟2.1,取得空閑子線程;

步驟2.2,建立用于存儲開源項目的文件系統(tǒng);

步驟2.3,創(chuàng)建抓取資源的任務(wù)記錄。

上述的一種自適應(yīng)的網(wǎng)絡(luò)資源收集方法,收集單元用于對目標(biāo)網(wǎng)絡(luò)資源的抓取,包括以下子步驟:

步驟3.1,根據(jù)爬蟲依賴模塊中的依賴關(guān)系找到相應(yīng)的爬蟲執(zhí)行單元,在步驟2.1取得的子線程中建立一個該爬蟲類的實例;

步驟3.2,調(diào)用統(tǒng)一爬蟲程序接口進(jìn)行數(shù)據(jù)抓取。

優(yōu)化的,上述的一種自適應(yīng)的網(wǎng)絡(luò)資源收集方法,關(guān)閉單元在抓取完成后釋放系統(tǒng)開銷,包括以下子步驟:

步驟4.1,在步驟2.3創(chuàng)建的任務(wù)記錄中記錄任務(wù)結(jié)束信息。

步驟4.2,步驟4.2,釋放該任務(wù)占用的子線程。

優(yōu)化的,上述的一種自適應(yīng)的網(wǎng)絡(luò)資源收集方法,關(guān)閉單元在在抓取出錯后能進(jìn)行異常處理,包括以下子步驟:

步驟5.1:關(guān)閉單元定期讀取步驟2.3中創(chuàng)建的任務(wù)記錄,將所述任務(wù)記錄中未記載結(jié)束信息的任務(wù)判定為未完成任務(wù),向未完成任務(wù)的收集單元發(fā)送檢測信號,若收集單元未回應(yīng),則將該任務(wù)判定為異常任務(wù),然后執(zhí)行步驟5.2;

步驟5.2,強制關(guān)閉異常任務(wù),并在步驟2.3創(chuàng)建的任務(wù)記錄中記錄該任務(wù)的關(guān)閉時間,以及異常堆棧信息。

步驟5.3,釋放該任務(wù)占用的子線程。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué),未經(jīng)北京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410155856.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: **毛片在线| 成年人性生活免费看| 国产精品九九九九九九| 欧美资源一区| 一色桃子av| 中文字幕区一区二| 国产清纯白嫩初高生在线观看性色| 亚洲欧洲日本在线观看| 日韩精品一区二区三区四区在线观看| 色综合久久网| 国产精品1区2区| 国产69精品福利视频| 亚洲精品国产主播一区| 一本大道久久a久久精品| 91精品国产高清一区二区三区| 一区二区三区欧美日韩| 色妞www精品视频| 欧美国产一二三区| 大伊人av| 久久精品一二三| 国产午夜一区二区三区| 亚洲高清毛片一区二区| 色噜噜狠狠一区二区| 中文av一区| 久久久精品久久日韩一区综合| 高清欧美精品xxxxx在线看| 免费看欧美中韩毛片影院| 一区二区三区欧美日韩| 国产视频一区二区三区四区| 国产精品精品国内自产拍下载| 久久国产精品网站| 日本道欧美一区二区aaaa| 夜夜躁人人爽天天天天大学生| 一区精品二区国产| 日韩欧美一区二区在线视频| 欧美一区二区三区久久精品视 | 日韩不卡毛片| 国内自拍偷拍一区| 国产二区不卡| 99久久国产综合精品尤物酒店| 少妇高潮一区二区三区99小说| 激情久久精品| 性少妇freesexvideos高清bbw| 国产一区二区精品在线| 麻豆视频免费播放| 欧洲精品一区二区三区久久| 亚洲高清国产精品| 国产欧美日韩一级| 麻豆天堂网| 亚洲二区在线播放视频| 国产一级片子| 激情久久久| 国内精品国产三级国产99| 国产乱对白刺激视频在线观看| 国产欧美一区二区精品婷| 99热久久这里只精品国产www | 99热久久精品免费精品| 国产一区第一页| 久久99久久99精品免观看软件 | 一本色道久久综合亚洲精品浪潮| 岛国黄色av| 国产性猛交96| 久久久精品99久久精品36亚| 国产精品一区二区av麻豆| 日韩国产精品一区二区| 久久久99精品国产一区二区三区| 性精品18videosex欧美| 午夜av免费看| 国产欧美视频一区二区| 国产精品免费自拍| 日本丰满岳妇伦3在线观看 | 激情久久久久久| 99国精视频一区一区一三| 91麻豆精品国产91久久久久| 国产色婷婷精品综合在线手机播放| 国产另类一区| 国产精品日韩在线观看| 日韩av在线中文| 97国产婷婷综合在线视频,| 国产白丝一区二区三区| 少妇又紧又色又爽又刺激的视频| 欧美乱妇在线观看| 国产精品日韩一区二区三区| 国产精品国外精品| 狠狠色噜噜狼狼狼色综合久| 国产一区午夜| 久久99国产视频| 精品国产鲁一鲁一区二区三区| 欧美精品免费一区二区| 色婷婷综合久久久久中文| 99国产精品免费| 欧美色图视频一区| 国产欧美日韩二区| 亚洲四区在线| 国产精品乱战久久久| 99日本精品| 精品香蕉一区二区三区| 日韩精品一二区| 国精产品一二四区在线看| 欧美精品日韩一区| 国产中文字幕一区二区三区| 国产大片黄在线观看私人影院| 国产精品v欧美精品v日韩| 久久久综合亚洲91久久98| 99视频国产精品| 伊人欧美一区| 久久精品欧美一区二区| 女人被爽到高潮呻吟免费看 | 国产精品美女www爽爽爽视频| 久久69视频| 在线国产一区二区三区| 国产亚洲精品久久19p| 欧美一区二三区人人喊爽| 亚洲国产精品综合| 91精品啪在线观看国产| 一区二区欧美视频| 黄色av中文字幕| 狠狠插狠狠插| 精品久久久久久中文字幕大豆网 | 国产欧美亚洲精品第一区软件| 鲁一鲁一鲁一鲁一鲁一av| 99久久精品一区二区| 久久人人爽爽| 国产特级淫片免费看| 波多野结衣女教师电影| 99国产精品免费观看视频re| 精品福利一区| 午夜生活理论片| 亚洲乱码一区二区三区三上悠亚 | 日本一区二区免费电影| 一本色道久久综合亚洲精品浪潮| 亚洲欧洲另类精品久久综合| 素人av在线| 香港三日本三级三级三级| 国产日韩欧美精品一区| 欧美精品一区二区三区视频| 久久精品国产亚洲一区二区| 久久第一区| 欧美一区二区综合| 国产精品伦一区二区三区在线观看| 欧美日韩三区二区| 夜夜爽av福利精品导航| 国产91精品一区| 午夜影院色| 福利电影一区二区三区| 日本免费电影一区二区三区| 国产精品久久91| 九一国产精品| 日韩av中文字幕在线免费观看| 韩国女主播一区二区| 亚洲欧美色一区二区三区| 国产乱子一区二区| 色综合久久网| 日韩精品免费看| 好吊色欧美一区二区三区视频| 99久久精品国产系列| 激情欧美一区二区三区| 日本一区二区高清| 99国产精品一区二区| 国产午夜精品免费一区二区三区视频 | 国产亚洲精品久久久456| 一区二区三区中文字幕| 国产精品精品国内自产拍下载| 国产一区免费在线观看| 亚洲欧美另类久久久精品2019| 国产精品爽到爆呻吟高潮不挺| 国产www亚洲а∨天堂| 国产一区观看| 欧美freesex极品少妇| 夜夜精品视频一区二区| 日韩精品一区二区亚洲| 一区二区三区在线观看国产| 日韩av不卡一区二区| 欧美日韩一区二区三区在线观看视频| 欧美一区二区三区在线视频播放| 亚洲自偷精品视频自拍| 中文字幕在线视频一区二区| 91avpro| 国产精品一区二区日韩新区| 99久久久久久国产精品| 免费**毛片| 国产一区欧美一区| 日韩精品中文字幕一区二区三区 | 久久中文一区| 欧美激情精品一区| 蜜臀久久99精品久久久久久网站| 国产日韩一区二区在线| 狠狠躁狠狠躁视频专区| 69精品久久| 国产精品久久人人做人人爽| 日韩精品一区二区三区不卡| 国产一区网址| 国产精品亚洲一区二区三区| 黄毛片免费| 免费在线观看国产精品| 国产第一区在线观看| 久久久久亚洲精品视频| 亚洲w码欧洲s码免费| 色噜噜狠狠色综合影视| 国产精品一区一区三区| 国产91丝袜在线| 欧美精品中文字幕在线观看| 色一情一乱一乱一区免费网站 | 国产一区在线免费观看| 国产69精品久久| 午夜影院色| 午夜影院毛片| 国产在线一卡| 亚洲精品久久久久中文第一暮| 国产日韩欧美精品| 91精品国产高清一区二区三区| 国产精品亚洲精品一区二区三区| 午夜av网址| 国产视频在线一区二区| 99国产精品99久久久久久粉嫩| 日本一二三四区视频| 91福利试看| 欧美激情综合在线| 国产91免费在线| 精品久久久综合| 国产日韩欧美三级| 国产精品日产欧美久久久久| 国产福利一区在线观看| 日韩免费一级视频| 国产精品久久人人做人人爽| 99视频一区| 国产午夜精品一区二区三区在线观看 | 在线视频国产一区二区| 国产精品高潮呻吟三区四区| 国产精品欧美久久久久一区二区| www.成| 午夜伦全在线观看| 99精品欧美一区二区| 国产大片黄在线观看私人影院 | 欧美激情午夜| 日本少妇一区二区三区| 国内精品久久久久影院日本| 国产视频二区| 99精品欧美一区二区三区美图| 国产精品1区2区| 精品国产免费一区二区三区| 窝窝午夜精品一区二区| 欧美一区二区久久| 久久精品手机视频| 日韩精品乱码久久久久久| 91精品系列|