日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于scrapy的分布式暗網(wǎng)資源挖掘系統(tǒng)及方法在審

專利信息
申請?zhí)枺?/td> 201810558520.2 申請日: 2018-06-01
公開(公告)號: CN108829792A 公開(公告)日: 2018-11-16
發(fā)明(設(shè)計(jì))人: 劉丹;杜鳳媛;王永松;鄭云彬 申請(專利權(quán))人: 成都康喬電子有限責(zé)任公司;電子科技大學(xué)
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 成都虹橋?qū)@聞?wù)所(普通合伙) 51124 代理人: 陳立志
地址: 610041 四*** 國省代碼: 四川;51
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 暗網(wǎng) 資源挖掘 任務(wù)隊(duì)列 控制模塊 中心節(jié)點(diǎn) 網(wǎng)頁 任務(wù)預(yù)處理 爬蟲 爬蟲種子 數(shù)據(jù)挖掘 管理器 存儲
【說明書】:

發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,公開了一種基于scrapy的分布式暗網(wǎng)資源挖掘系統(tǒng)及方法,用以提升暗網(wǎng)資源挖掘的效率、廣度以及靈活性。本發(fā)明包括中心節(jié)點(diǎn)控制模塊和從節(jié)點(diǎn)爬取模塊,所述中心節(jié)點(diǎn)控制模塊包括爬蟲種子任務(wù)隊(duì)列、任務(wù)預(yù)處理模塊、暗網(wǎng)任務(wù)隊(duì)列和明網(wǎng)任務(wù)隊(duì)列,所述從節(jié)點(diǎn)爬取模塊包括暗網(wǎng)爬取模塊、明網(wǎng)爬取模塊和爬蟲管理器;暗網(wǎng)在人為提供和通過明網(wǎng)爬取得暗網(wǎng)域名的基礎(chǔ)上再通過暗網(wǎng)爬取模塊和明網(wǎng)爬取模塊從暗網(wǎng)頁面和明網(wǎng)網(wǎng)頁中爬取更多的暗網(wǎng)域名,從而實(shí)現(xiàn)對暗網(wǎng)域名的大量獲取以及對暗網(wǎng)網(wǎng)頁頁面的存儲。本發(fā)明適用于暗網(wǎng)資源挖掘。

技術(shù)領(lǐng)域

本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,特別涉及基于scrapy的分布式暗網(wǎng)資源挖掘系統(tǒng)及方法。

背景技術(shù)

暗網(wǎng)是指通過特殊軟件或使用非標(biāo)準(zhǔn)的通信協(xié)議和端口才能訪問的網(wǎng)絡(luò)。Tor是目前最主流的暗網(wǎng)匿名通信系統(tǒng),由于暗網(wǎng)的完全匿名性的特點(diǎn),孕育了大量的非法交易。因此研究對暗網(wǎng)資源的挖掘有重大意義。傳統(tǒng)的搜索引擎和爬蟲技術(shù)能夠爬取的僅僅是互聯(lián)網(wǎng)上提供的小部分web信息,即明網(wǎng)上的信息。不能實(shí)現(xiàn)對暗網(wǎng)資源的挖掘。現(xiàn)有的研究大多又是針對互聯(lián)網(wǎng)上不能被標(biāo)準(zhǔn)搜素引擎索引的非表面網(wǎng)絡(luò)內(nèi)容即深網(wǎng),并不是現(xiàn)在所謂的暗網(wǎng);少數(shù)雖然針對暗網(wǎng)進(jìn)行研究及爬取,但在設(shè)計(jì)上沒有考慮爬取的效率,廣度,以及靈活性。

Scrapy是目前最主流的爬蟲框架,它是基于twisted異步網(wǎng)絡(luò)庫實(shí)現(xiàn)的,在爬取速度上相對其他爬蟲是高效的,且具有可定制性。然而Scrapy提供的下載模塊是基于http協(xié)議實(shí)現(xiàn)的,暗網(wǎng)使用的是socke協(xié)議。另外由于網(wǎng)絡(luò)爬蟲對I/O的要求較高,Scrapy將待爬取的URLs直接存儲在內(nèi)存中而非硬盤中,這樣一來,在爬取大量的暗網(wǎng)時時,當(dāng)爬取的網(wǎng)頁數(shù)量達(dá)到數(shù)萬時,需要存儲的URLs數(shù)量可能會超過百萬甚至千萬,再加上Python本身是腳本語言,其對象占用內(nèi)存往往比C/C++等編譯型語言要大得多,而且Python垃圾收集器的釋放內(nèi)存算法并不會在對象不再被引用時立即釋放內(nèi)存。因此,很可能會導(dǎo)致單機(jī)內(nèi)存枯竭。單機(jī)使用scrapy爬取,內(nèi)存將會是瓶頸。

發(fā)明內(nèi)容

本發(fā)明要解決的技術(shù)問題是:提供一種基于scrapy的分布式暗網(wǎng)資源挖掘系統(tǒng)及方法,用以提升暗網(wǎng)資源挖掘的效率、廣度以及靈活性。

為解決上述問題,本發(fā)明采用的技術(shù)方案是:

基于scrapy的分布式暗網(wǎng)資源挖掘系統(tǒng),包括中心節(jié)點(diǎn)控制模塊和從節(jié)點(diǎn)爬取模塊,所述中心節(jié)點(diǎn)控制模塊包括爬蟲種子任務(wù)隊(duì)列、任務(wù)預(yù)處理模塊、暗網(wǎng)任務(wù)隊(duì)列和明網(wǎng)任務(wù)隊(duì)列,所述從節(jié)點(diǎn)爬取模塊包括暗網(wǎng)爬取模塊、明網(wǎng)爬取模塊和爬蟲管理器;

所述爬蟲種子任務(wù)隊(duì)列用于存儲用戶提供的待爬取種子任務(wù),以及從節(jié)點(diǎn)爬取模塊提取的新的待爬取的種子任務(wù);所述任務(wù)預(yù)處理模塊用于對爬蟲種子任務(wù)隊(duì)列中的任務(wù)進(jìn)行匹配以及去重過濾,并將屬于暗網(wǎng)的任務(wù)存入暗網(wǎng)任務(wù)隊(duì)列,屬于明網(wǎng)的任務(wù)存入明網(wǎng)任務(wù)隊(duì)列;

所述暗網(wǎng)爬取模塊中的暗網(wǎng)爬蟲用于從暗網(wǎng)任務(wù)隊(duì)列中讀取暗網(wǎng)爬取任務(wù),基于暗網(wǎng)爬取任務(wù)下載對應(yīng)的暗網(wǎng)網(wǎng)頁,并從暗網(wǎng)網(wǎng)頁中提取新的暗網(wǎng)域名,將提取到的新的暗網(wǎng)域名存入爬蟲種子任務(wù)隊(duì)列;所述明網(wǎng)爬取模塊中的明網(wǎng)爬蟲用于從明網(wǎng)任務(wù)隊(duì)列中讀取明網(wǎng)爬取任務(wù),基于明網(wǎng)爬取任務(wù)下載對應(yīng)的明網(wǎng)網(wǎng)頁,并從明網(wǎng)網(wǎng)頁中提取新的明網(wǎng)域名和暗網(wǎng)域名,將提取到的新的明網(wǎng)域名和暗網(wǎng)域名存入爬蟲種子任務(wù)隊(duì)列;所述爬蟲管理器用于根據(jù)中心節(jié)點(diǎn)控制模塊發(fā)送的請求信息,對爬蟲進(jìn)程進(jìn)行管理。

進(jìn)一步的,本發(fā)明還包括Redis數(shù)據(jù)庫,所述Redis數(shù)據(jù)庫用于存儲暗網(wǎng)任務(wù)隊(duì)列和明網(wǎng)任務(wù)隊(duì)列。

進(jìn)一步的,本發(fā)明還包括kafka消息系統(tǒng),所述kafka消息系統(tǒng)用于存儲爬蟲種子任務(wù)隊(duì)列。

進(jìn)一步的,本發(fā)明還包括MongoDB數(shù)據(jù)庫,所述MongoDB數(shù)據(jù)庫用于存儲暗網(wǎng)爬取模塊所下載的暗網(wǎng)網(wǎng)頁以及明網(wǎng)爬取模塊所下載的明網(wǎng)網(wǎng)頁。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都康喬電子有限責(zé)任公司;電子科技大學(xué),未經(jīng)成都康喬電子有限責(zé)任公司;電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810558520.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩精品人成在线播放| 国产欧美一区二区三区免费视频| 国产日韩欧美一区二区在线观看 | 一本色道久久综合亚洲精品浪潮| 日韩欧美精品一区二区三区经典| 国产美女视频一区二区三区| 国产精品综合一区二区三区| 国产色午夜婷婷一区二区三区 | 日韩av一二三四区| 7777久久久国产精品| 自拍偷在线精品自拍偷无码专区| 自拍偷在线精品自拍偷无码专区 | 四虎影视亚洲精品国产原创优播| 91麻豆精品一区二区三区| 一区二区三区电影在线观看| 玖玖玖国产精品| 国产99网站| 少妇性色午夜淫片aaa播放5| 久久激情图片| 公乱妇hd在线播放bd| 国产一区二区三区国产| 国产精品6699| 国产精品欧美日韩在线| 99精品少妇| 欧美一区二区在线不卡| 久久久久亚洲精品视频| 李采潭无删减版大尺度| 96精品国产| 国产精品视频免费一区二区| 精品欧美一区二区精品久久小说| 国内自拍偷拍一区| 久久国产这里只有精品| 男女视频一区二区三区| 欧美精品免费看| 欧美日韩国产区| 91久久香蕉| 日本精品一区二区三区在线观看视频| 午夜看片网址| 超碰97国产精品人人cao| 精品一区欧美| 欧美日韩一区二区三区精品 | 日韩一级在线视频| 国产大片黄在线观看私人影院 | 亚洲福利视频一区| 国语精品一区| 国产区图片区一区二区三区| 69xx国产| 日韩精品一区二区三区免费观看视频 | 国产精品伦一区二区三区视频| 久久第一区| 一区二区三区欧美精品| av毛片精品| 999偷拍精品视频| 性精品18videosex欧美| 欧美色综合天天久久综合精品| 91麻豆精品国产综合久久久久久| 欧美三区二区一区| 国产天堂一区二区三区| 午夜激情在线播放| 国产全肉乱妇杂乱视频在线观看| 国产精品一区二区在线观看| 国产有码aaaae毛片视频| 色婷婷精品久久二区二区蜜臂av| 日本一区二区三区在线视频| 夜夜夜夜夜猛噜噜噜噜噜gg| 九九热国产精品视频| 久久99久久99精品免观看软件| 午夜精品一二三区| 精品国产1区2区| 夜夜嗨av禁果av粉嫩av懂色av | 秋霞三级伦理| 91久久国产视频| 国产精品免费一区二区区| 久久精品99国产精品亚洲最刺激| 国产乱码精品一区二区三区介绍| 日本美女视频一区二区三区| 26uuu亚洲国产精品| 爱看av在线入口| 91视频国产一区| 91国偷自产一区二区介绍| 农村妇女精品一二区| 国产91电影在线观看| 欧美精品在线一区二区| 精品国产1区2区3区| 99久久精品免费看国产交换| 97久久精品人人做人人爽| 大bbw大bbw超大bbw| 强制中出し~大桥未久10在线播放| 欧美一级久久精品| 午夜wwww| 国产一区www| 亚洲精品少妇久久久久| 国产免费区| 麻豆精品一区二区三区在线观看| 夜夜躁狠狠躁日日躁2024| 国产精品国产三级国产专区55| 国产一区二区国产| 日韩av在线高清| **毛片免费| 精品国产伦一区二区三区| 91一区在线| 国产精品美女久久久免费| 中文字幕欧美久久日高清| 日韩欧美国产高清91| 欧美在线视频三区| 中文字幕欧美另类精品亚洲| 99爱精品视频| av素人在线| 久久久久亚洲| 午夜影院h| 精品国产一二区| 久久国产精彩视频| 久久久一二区| 一色桃子av大全在线播放| 色妞www精品视频| 国产欧美亚洲一区二区| 国产精品久久久久久久久久久不卡| 亚洲s码欧洲m码在线观看| 97久久精品人人做人人爽| 久久久一区二区精品| 国产91精品一区二区麻豆亚洲| 精品久久二区| 波多野结衣女教师30分钟| 猛男大粗猛爽h男人味| 亚洲午夜精品一区二区三区电影院 | 性欧美一区二区三区| 免费看大黄毛片全集免费| 一区二区三区欧美精品| 国产精品伦一区二区三区在线观看 | 色婷婷精品久久二区二区蜜臂av| 日韩一级视频在线| 中文字幕在线一二三区| 高清欧美精品xxxxx| 国产精品一区二区三区在线看| 国产三级精品在线观看| 国产一区在线精品| 国产日韩欧美另类| 狠狠色噜噜狠狠狠狠米奇777| 日日夜夜亚洲精品| 91精品一区二区中文字幕| 欧美日韩亚洲另类| 中文字幕日韩精品在线| 国产精品天堂网| 丰满岳乱妇bd在线观看k8| 欧美久久一区二区三区| 午夜av片| 免费观看又色又爽又刺激的视频| 视频国产一区二区| 97人人揉人人捏人人添| 午夜精品影视| 乱淫免费视频| 国产欧美日韩一区二区三区四区 | 日韩精品久久久久久久的张开腿让 | 国产第一区在线观看| 欧美精品二区三区| 国产日韩欧美精品一区| 少妇av一区二区三区| 香蕉免费一区二区三区在线观看| 欧美一区二区三区久久精品| 欧美日韩国产色综合一二三四| 国产精品视频二区不卡| 国产亚洲精品久久久久秋霞| 日韩精品少妇一区二区在线看| 国产精品刺激对白麻豆99| 国产黄一区二区毛片免下载| 中文字幕日本精品一区二区三区| 国产高清一区二区在线观看| 欧美一区二区在线不卡 | 午夜影院激情| 91黄色免费看| 精品福利一区| 国产精品奇米一区二区三区小说| 国产午夜精品一区二区理论影院| 中文在线√天堂| 中文字幕一区二区三区免费视频| 国产精品日韩精品欧美精品| 国产精品国产三级国产aⅴ下载| 国产一区二区精品在线| 精品国产亚洲一区二区三区| 国产天堂第一区| xxxx在线视频| 国产一级片子| 日韩中文字幕在线一区| 日本高清不卡二区| 成年人性生活免费看| 99久久免费精品国产免费高清| 亚洲国产精品一区在线| 国产精品一区在线播放| 国产一区影院| 午夜情所理论片| 免费**毛片| 国产精品久久久久久久久久久新郎| 欧美精品综合视频| 欧美精品一卡二卡| 91久久国产露脸精品国产| 久久婷婷国产综合一区二区| 丰满岳乱妇bd在线观看k8| 久久99久久99精品免观看软件 | 九色国产精品入口| 久久乐国产精品| 右手影院av| 国产一区在线免费| 色综合久久综合| 久久一级精品视频| 国产精品美女一区二区视频| 狠狠色噜噜狠狠狠狠2018| 午夜剧场一级片| 野花社区不卡一卡二| 欧美日韩三区二区| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 少妇太爽了在线观看免费| 久久久精品观看| 国产乱xxxxx国语对白| 色婷婷综合久久久久中文| 久草精品一区| 国产在线干| 欧美日韩久久一区二区 | 在线观看欧美日韩国产| 狠狠色丁香久久综合频道| 亚洲乱在线| 娇妻被又大又粗又长又硬好爽 | 国产精品久久久不卡| 日韩亚洲精品在线| xoxoxo亚洲国产精品| 91精品国产九九九久久久亚洲 | 国产69精品久久99的直播节目| 欧美一区二区三区在线免费观看| 狠狠色噜噜狠狠狠狠色吗综合| 国产日本一区二区三区| 日韩中文字幕亚洲精品欧美| 国产精品伦一区二区三区在线观看 | 88888888国产一区二区| 91午夜在线| 精品国精品国产自在久不卡| 国产精品免费专区| av中文字幕一区二区| 国产一级大片| 国产69精品久久久久999天美| 国产91精品高清一区二区三区| 亚洲国产精品麻豆| 激情aⅴ欧美一区二区三区| 精品久久不卡| 欧美日韩久久一区| 国产免费观看一区| 99久久精品免费视频| 国产激情视频一区二区|