日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于配置的分布式公文數據采集系統在審

專利信息
申請號: 201910523201.2 申請日: 2019-06-17
公開(公告)號: CN110297960A 公開(公告)日: 2019-10-01
發明(設計)人: 馬新凡;刁烽;宋旻雨;李澤松;劉福強;孫俊杰;熊志豪 申請(專利權)人: 中電科大數據研究院有限公司
主分類號: G06F16/951 分類號: G06F16/951;G06F16/9538;G06F16/958
代理公司: 貴陽睿騰知識產權代理有限公司 52114 代理人: 宋妍麗
地址: 550000 貴州省貴陽市貴陽*** 國省代碼: 貴州;52
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 公文數據 任務處理器 數據存儲器 爬蟲 采集系統 配置的 校驗器 異構性 配置 分布式數據采集 報警監控功能 數據存儲系統 可視化界面 操作管理 多數據源 功能獲取 公文模板 可管理性 可擴展性 實時獲取 數據結果 水平擴展 問題追蹤 郵件推送 高效性 數據源 中間件 屏蔽 部署 展示 統計 統一 維護
【說明書】:

發明提供了一種基于配置的分布式公文數據采集系統,包括配置校驗器、爬蟲任務處理器、數據存儲器;所述配置校驗器、爬蟲任務處理器、數據存儲器由上至下逐層部署。本發明具備高效性,通過配置化實現數據實時獲取,無需編碼,有效提高了公文數據的獲取效率;具備可管理性,通過可視化界面對公文模板和獲取結果進行展示、統一操作管理,可通過郵件推送功能獲取數據結果增量統計,可通過報警監控功能進行問題追蹤,便于維護;具備可擴展性,可以根據需要進行水平擴展,實現分布式數據采集;具備數據異構性,爬取海量多數據源的公文數據時,通過Redis作為中間件,屏蔽了數據源和數據存儲系統的異構性。

技術領域

本發明涉及一種基于配置的分布式公文數據采集系統,屬于大數據技術領域。

背景技術

21世紀是一個大數據時代,數據無處不在,存在于生活的方方面面。無論是出于數據分析還是產品需求,我們都需要從某些網站提取出我們感興趣,有價值的內容。但由于收集數據是一個重復性工作,且人力有窮盡,所以爬蟲應運而生,并且迅速的發展壯大。

爬蟲是通過編寫一段代碼,來獲取目標網站上我們感興趣的數據,減少人為工作量。爬蟲的主要流程:獲取一個初始網頁的URL,獲得初始URL上的所有信息,再次在獲得的信息中抓取我們感興趣的內容,并對該內容進行解析匹配,最終保存到數據庫。對所有URL分別執行上述流程,直到遍歷完所有的URL。一般而言,爬蟲總體可分為網絡請求模塊、爬取流程控制模塊和內容分析提取模塊三個模塊.

如今市面上的爬蟲功能一般分為數據采集(下載相關的網頁),數據處理(對相關網頁的數據進行分析)和數據存儲(將所需要爬取的內容進行保存)三個部分的內容,而高級的爬蟲則使用了分布式技術以及并發編程用于相關數據爬取以及分析。在過去爬蟲所爬取的網站頁面主要是html文檔本身,所以爬蟲所抓取的內容大部分都是html中包含的內容,但是隨著前端技術的發展,動態網頁的概率越來越大,這些動態網站中使用了ajax技術,相比起傳統的html文檔,如今很多網頁的信息都是通過javascript動態生成的。網頁的多樣性導致了常見的爬蟲程序無法適用不同格式的網頁,在針對不同格式的網站爬取時后端程序員需要在原有代碼上進行修改,這極大的降低了工作效率和代碼維護性。

發明內容

為解決上述技術問題,本發明提供了一種基于配置的分布式公文數據采集系統,該基于配置的分布式公文數據采集系統通過以配置文件為核心的方式,可提供在線配置的方式以替代現有的編寫執行代碼的方式,從而極大的提高工作效率。

本發明通過以下技術方案得以實現。

本發明提供的一種基于配置的分布式公文數據采集系統,包括配置校驗器、爬蟲任務處理器、數據存儲器;所述配置校驗器、爬蟲任務處理器、數據存儲器由上至下逐層部署,其中:

配置校驗器讀取配置文件,對讀取到的配置文件進行校驗,校驗通過則根據配置文件的配置項調用爬蟲任務處理器執行;

爬蟲任務處理器根據配置項生成任務列表,以預設周期對任務列表中的任務逐項執行,每項任務根據配置項的內容爬取數據并將爬取到的數據通過數據存儲器進行存儲,爬取數據過程中對爬取的數據進行模板匹配,爬取數據和模板匹配的過程與結果信息保存于詳情列表;

數據存儲器對所爬取的數據的數據格式進行解析,將文本數據以結構化方式存儲,將圖片數據和附件以非結構化方式存儲。

還包括任務監控模塊,任務監控模塊對任務列表的生成過程以及任務列表中每項任務的執行狀態進行監控。

還部署有REST服務模塊,REST服務模塊提供一次性的任務生成及調度。

所述數據存儲器中,對于非結構化方式存儲的數據,將指向數據路徑的字段以json方式存儲于文本數據。

所述數據存儲器為Redis。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中電科大數據研究院有限公司,未經中電科大數據研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910523201.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲国产精品国自产拍久久| 国产一级一区二区| 亚洲高清久久久| 日韩av电影手机在线观看| 91国内精品白嫩初高生| 性刺激久久久久久久久九色| 国产女性无套免费看网站| 欧洲激情一区二区| 狠狠干一区| 在线精品视频一区| 久久国产精品精品国产| 精品国产一区二区三区久久久久久 | 国产区二区| 久久久久国产精品一区二区三区| 在线观看国产91| 亚洲欧洲另类精品久久综合| 视频一区欧美| 国产性猛交96| 日本精品三区| 精品少妇的一区二区三区四区| 国产91综合一区在线观看| 国产97久久| 亚洲一级中文字幕| 亚洲精品色婷婷| 国产一区二区三区中文字幕| 三级午夜片| 日韩欧美国产高清91| 欧美xxxxxhd| 91福利视频免费观看| 欧美在线视频一二三区| 一区二区中文字幕在线观看| 日本三级香港三级| 欧美日韩乱码| 欧美精品免费看| 国产伦理久久精品久久久久| 亚洲美女在线一区| 肉丝肉足丝袜一区二区三区| 亚洲国产一区二区久久久777| 久久综合狠狠狠色97| 国产在线一二区| 亚洲国产精品区| 国产乱色国产精品播放视频| 亚洲制服丝袜在线| 91福利试看| 国产亚洲精品久久19p| 夜夜爱av| 亚洲区在线| 狠狠色狠狠综合久久| 99精品国产99久久久久久97| 欧美亚洲视频一区二区| 97人人澡人人爽人人模亚洲| 亚洲精品国产91| 精品久久一区| 欧美三区视频| 999亚洲国产精| 国产无遮挡又黄又爽免费网站| av午夜影院| 国产69精品久久99不卡免费版| 国产v亚洲v日韩v欧美v片| 福利片91| 久久久中精品2020中文| 肉丝肉足丝袜一区二区三区| 精品国产一级| 国产一区二区影院| www.成| 国产在线精品一区二区| 午夜看片网| 国产欧美日韩一区二区三区四区| 久久免费视频一区二区| 国产欧美视频一区二区三区| 久久99久久99精品免观看软件| 99久久精品国产国产毛片小说| 国产91精品一区二区麻豆亚洲| 久久国产精品广西柳州门| 国内久久精品视频| 国产日韩欧美在线一区| 国产精品久久国产三级国电话系列 | 亚洲精品乱码久久久久久高潮| 91精品国产九九九久久久亚洲| 日韩av三区| 国偷自产中文字幕亚洲手机在线| 夜夜夜夜曰天天天天拍国产| 99久久久国产精品免费无卡顿| 日韩av在线影视| 午夜爽爽爽男女免费观看| 国内精品在线免费| 91久久国产露脸精品国产| 国产精品伦一区二区三区级视频频| 亚洲精品乱码久久久久久麻豆不卡| 日韩国产精品一区二区| 女人被爽到高潮呻吟免费看| 视频一区二区三区欧美| 自拍偷在线精品自拍偷写真图片| 国产一区二区电影| 19videosex性欧美69| 欧美日韩激情一区| 精品国产乱码一区二区三区a| 久久婷婷国产麻豆91天堂徐州| 久久69视频| 国产精品亚洲一区二区三区| 久久精品综合| 国产经典一区二区三区| 日本美女视频一区二区三区| 亚洲国产精品网站| 99国产午夜精品一区二区天美| 天摸夜夜添久久精品亚洲人成 | 国产亚洲精品久久19p| 少妇特黄v一区二区三区图片| 亚洲精品少妇一区二区| 午夜av资源| 狠狠色噜噜狠狠狠狠综合久| 国产综合久久精品| 欧美在线观看视频一区二区三区| 亚洲欧洲精品一区二区三区不卡| 国产日韩一区二区在线| 国产中文字幕一区二区三区| 国产精品96久久久| 91久久国产露脸精品| 久久久久久久久亚洲精品| 欧美一区二区精品久久911| 少妇高潮大叫喷水| 久久99精品国产麻豆宅宅| 日本午夜一区二区| 亚洲欧美一区二| 欧美髙清性xxxxhdvid| 国语精品一区| 久久九九亚洲| 97精品国产aⅴ7777| 国产第一区二区| 欧美一区二区三区在线视频观看| 免费91麻豆精品国产自产在线观看| 欧美精品一卡二卡| 北条麻妃久久99精品| 午夜国内精品a一区二区桃色| 91理论片午午伦夜理片久久| 中文字幕欧美另类精品亚洲| 欧美精品亚洲一区| 国产精品综合一区二区| 欧美一区二区三区激情| 日韩欧美一区精品| 日本午夜久久| 久久久久久亚洲精品| 中文字幕av一区二区三区高| 国产区一区| 69久久夜色精品国产69–| 亚洲**毛茸茸| 精品国产二区三区| 亚洲精品无吗| 少妇bbwbbwbbw高潮| 911久久香蕉国产线看观看| 国产精品96久久久久久久| 99久久精品一区二区| 欧美日韩一区二区三区免费| 亚洲精品久久久中文| 激情久久一区二区| 97精品国产97久久久久久| 精品一区二区三区自拍图片区| 日韩a一级欧美一级在线播放| 国产一区www| 四虎精品寂寞少妇在线观看| 免费看农村bbwbbw高潮| 日本看片一区二区三区高清| 91精品国产综合久久国产大片| 欧美日韩一级黄| 狠狠躁夜夜av| 中文字幕视频一区二区| 亚洲国产精品入口| 一级久久久| 国产精品一卡二卡在线观看| 国产极品一区二区三区| 国产欧美日韩二区| 午夜色影院| 九九国产精品视频| 国产极品一区二区三区| 91久久国产视频| 少妇又紧又色又爽又刺激视频网站| 蜜臀久久99精品久久久| 国产影院一区二区| 色婷婷噜噜久久国产精品12p| 一区二区三区欧美日韩| 日韩午夜电影在线| 午夜影院一区| 妖精视频一区二区三区| 国产日韩一二三区| 国产精品网站一区| 国产91视频一区二区| 国产欧美日韩精品一区二区三区 | 国产精品一区二区在线观看免费| 日韩精品免费一区二区三区| 欧美日韩亚洲国产一区| 日韩电影在线一区二区三区| 狠狠色很很在鲁视频| 国产麻豆一区二区| 日韩av不卡一区| 日本久久丰满的少妇三区| 久草精品一区| 乱淫免费视频| 日韩av在线一区| 午夜性电影| 欧美一区免费| 日本精品一二三区| 一区二区三区国产欧美| 17c国产精品一区二区| 国内精品久久久久影院日本| 免费看农村bbwbbw高潮| 国产一级片网站| 玖玖国产精品视频| 国产精品一区二区不卡| 国产欧美一区二区在线| 国产午夜精品一区二区三区四区| 91久久国产露脸精品| 99久久免费精品国产男女性高好 | 午夜免费av电影| 99国产精品9| 丝袜美腿诱惑一区二区| 国产一区二区视频免费观看| 日韩精品一区二区三区四区在线观看| 91精品婷婷国产综合久久竹菊| 欧美日韩一区二区三区在线播放| 日韩精品久久一区二区| 亚洲欧美国产一区二区三区| 99久久国产综合精品女不卡| 国产精品一区二区人人爽| 欧美一区二区免费视频| 亚洲w码欧洲s码免费| 亚洲欧美一区二区三区1000| 一区二区午夜| 国产麻豆91欧美一区二区| 国产精品国产三级国产专区55| 狠狠色狠狠色很很综合很久久| 欧美日韩一区二区三区精品| 国产999精品视频| 国产色婷婷精品综合在线播放| 日本99精品| 国产日韩欧美精品| 亚洲自拍偷拍中文字幕| 伊人av综合网| 91一区在线| 欧美资源一区| 精品国产一区二区三区久久久久久 | 欧美色图视频一区| 亚洲午夜国产一区99re久久| 久久人人爽爽| 欧美日韩卡一卡二| 满春阁精品av在线导航 | 国产二区三区视频|