[發(fā)明專利]一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的方法在審
| 申請?zhí)枺?/td> | 202011244705.X | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112269910A | 公開(公告)日: | 2021-01-26 |
| 發(fā)明(設(shè)計)人: | 邢榮;徐宏偉;宋設(shè) | 申請(專利權(quán))人: | 浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/9538;G06F9/48 |
| 代理公司: | 濟南信達專利事務(wù)所有限公司 37100 | 代理人: | 孫晶偉 |
| 地址: | 214029 江蘇省無錫市濱*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 動態(tài) 采集 互聯(lián)網(wǎng) 數(shù)據(jù) 方法 | ||
1.一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的方法,其特征是獲取目標(biāo)網(wǎng)站公示模塊顯示的全部信息范圍內(nèi)首頁首條數(shù)據(jù)與末頁末條數(shù)據(jù)的發(fā)布時間差,作為信息所屬時間跨度,
依據(jù)時間跨度設(shè)定網(wǎng)絡(luò)爬蟲的定時啟動時間,定期自動獲取目標(biāo)網(wǎng)站上公示模塊的信息,并持續(xù)積累至信息數(shù)據(jù)集合。
2.根據(jù)權(quán)利要求1所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的方法,其特征是通過瀏覽器對目標(biāo)網(wǎng)站的公示模塊發(fā)送訪問請求,查看公示模塊顯示的全部信息范圍內(nèi)首頁首條數(shù)據(jù)與末頁末條數(shù)據(jù)的發(fā)布時間差。
3.根據(jù)權(quán)利要求1或2所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的方法,其特征是通過網(wǎng)絡(luò)爬蟲從全部信息范圍內(nèi)首頁首條數(shù)據(jù)遍歷至末頁末條數(shù)據(jù),進行信息抓取。
4.根據(jù)權(quán)利要求3所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的方法,其特征是網(wǎng)絡(luò)爬蟲的定時啟動間隔時長小于信息所屬時間跨度。
5.根據(jù)權(quán)利要求4所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的方法,其特征是每次定時啟動獲取的信息數(shù)據(jù)與上一次啟動獲取的信息數(shù)據(jù)進行比對,排除重復(fù)數(shù)據(jù),再進行保存入數(shù)據(jù)庫。
6.一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的系統(tǒng),其特征是包括時間跨度模塊、啟動模塊、獲取模塊及存儲模塊,
時間跨度模塊獲取目標(biāo)網(wǎng)站公示模塊顯示的全部信息范圍內(nèi)首頁首條數(shù)據(jù)與末頁末條數(shù)據(jù)的發(fā)布時間差,作為信息所屬時間跨度,
啟動模塊依據(jù)時間跨度設(shè)定網(wǎng)絡(luò)爬蟲的定時啟動時間,獲取模塊依據(jù)定時啟動時間定期自動獲取目標(biāo)網(wǎng)站上公示模塊的信息,并持續(xù)積累至存儲模塊的信息數(shù)據(jù)集合中。
7.根據(jù)權(quán)利要求6所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的系統(tǒng),其特征是時間跨度模塊通過瀏覽器對目標(biāo)網(wǎng)站的公示模塊發(fā)送訪問請求,查看公示模塊顯示的全部信息范圍內(nèi)首頁首條數(shù)據(jù)與末頁末條數(shù)據(jù)的發(fā)布時間差。
8.根據(jù)權(quán)利要求6或7所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的系統(tǒng),其特征是獲取模塊通過網(wǎng)絡(luò)爬蟲從全部信息范圍內(nèi)首頁首條數(shù)據(jù)遍歷至末頁末條數(shù)據(jù),進行信息抓取。
9.根據(jù)權(quán)利要求8所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的系統(tǒng),其特征是啟動模塊設(shè)定網(wǎng)絡(luò)爬蟲的定時啟動間隔時長小于信息所屬時間跨度。
10.根據(jù)權(quán)利要求9所述的一種動態(tài)采集互聯(lián)網(wǎng)數(shù)據(jù)的系統(tǒng),其特征是還包括比對模塊,比對模塊將每次定時啟動獲取的信息數(shù)據(jù)與上一次啟動獲取的信息數(shù)據(jù)進行比對,排除重復(fù)數(shù)據(jù),存儲模塊再進行保存入數(shù)據(jù)庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司,未經(jīng)浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011244705.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動攝像終端進行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





