[發(fā)明專(zhuān)利]網(wǎng)上信息抓取方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710149024.7 | 申請(qǐng)日: | 2017-03-14 |
| 公開(kāi)(公告)號(hào): | CN106874515A | 公開(kāi)(公告)日: | 2017-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 馬巖 | 申請(qǐng)(專(zhuān)利權(quán))人: | 深圳市博信諾達(dá)經(jīng)貿(mào)咨詢(xún)有限公司 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30 |
| 代理公司: | 深圳市科冠知識(shí)產(chǎn)權(quán)代理有限公司44355 | 代理人: | 王海駿 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)上 信息 抓取 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種網(wǎng)上信息抓取方法及系統(tǒng)。
背景技術(shù)
網(wǎng)絡(luò)爬蟲(chóng)(又被稱(chēng)為網(wǎng)頁(yè)蜘蛛,網(wǎng)絡(luò)機(jī)器人,在FOAF社區(qū)中間,更經(jīng)常的稱(chēng)為網(wǎng)頁(yè)追逐者),是一種按照一定的規(guī)則,自動(dòng)地抓取萬(wàn)維網(wǎng)信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動(dòng)索引、模擬程序或者蠕蟲(chóng)。
網(wǎng)絡(luò)爬蟲(chóng)實(shí)際是一種網(wǎng)絡(luò)信息抓取的應(yīng)用程序,現(xiàn)有的網(wǎng)絡(luò)爬蟲(chóng)無(wú)法依據(jù)抓取的信息判斷其處理策略,導(dǎo)致現(xiàn)有的網(wǎng)絡(luò)爬蟲(chóng)可能使得用戶(hù)侵犯別人的權(quán)利,安全性低。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┮环N網(wǎng)上信息抓取方法。其解決現(xiàn)有技術(shù)的技術(shù)方案侵犯別人的權(quán)利,安全性低的缺點(diǎn)。
一方面,提供一種網(wǎng)上信息抓取方法,所述方法包括如下步驟:網(wǎng)上信息抓取方法,所述方法包括如下步驟:
服務(wù)器接收用戶(hù)通過(guò)HTTP發(fā)送的信息抓取請(qǐng)求;
服務(wù)器從網(wǎng)絡(luò)中抓取與該抓取請(qǐng)求對(duì)應(yīng)的信息;
服務(wù)器依據(jù)該抓取請(qǐng)求對(duì)應(yīng)的信息內(nèi)包含的圖片信息確定該信息的處理策略。
可選的,所述方法還包括:
服務(wù)器如所述信息包含圖片信息,則將該信息存儲(chǔ),如所述信息不包含圖片信息,則將該信息分享。
可選的,所述方法還包括:
服務(wù)器通過(guò)社交軟件或即時(shí)通信軟件對(duì)所述信息分享。
第二方面,提供一種網(wǎng)上信息抓取系統(tǒng),所述系統(tǒng)包括:
獲取單元,用于接收用戶(hù)通過(guò)HTTP發(fā)送的信息抓取請(qǐng)求;
處理單元,用于從網(wǎng)絡(luò)中抓取與該抓取請(qǐng)求對(duì)應(yīng)的信息;依據(jù)該抓取請(qǐng)求對(duì)應(yīng)的信息內(nèi)包含的圖片信息確定該信息的處理策略。
可選的,所述系統(tǒng)還包括:
處理單元,用于服務(wù)器如所述信息包含圖片信息,則將該信息存儲(chǔ),如所述信息不包含圖片信息,則將該信息分享。
可選的,所述系統(tǒng)還包括:
處理單元,用于通過(guò)社交軟件或即時(shí)通信軟件對(duì)所述信息分享。
第三方面,提供一種服務(wù)器,包括:處理器、無(wú)線收發(fā)器、存儲(chǔ)器和總線,所述處理器、無(wú)線收發(fā)器、存儲(chǔ)器通過(guò)總線連接,所述無(wú)線收發(fā)器,用于接收用戶(hù)通過(guò)HTTP發(fā)送的信息抓取請(qǐng)求;
所述處理器,用于從網(wǎng)絡(luò)中抓取與該抓取請(qǐng)求對(duì)應(yīng)的信息;依據(jù)該抓取請(qǐng)求對(duì)應(yīng)的信息內(nèi)包含的圖片信息確定該信息的處理策略。
可選的,所述處理器,用于服務(wù)器如所述信息包含圖片信息,則將該信息存儲(chǔ),如所述信息不包含圖片信息,則將該信息分享。
可選的,所述處理器,用于通過(guò)社交軟件或即時(shí)通信軟件對(duì)所述信息分享。
本發(fā)明提供的技術(shù)方案通過(guò)抓取的信息是否包含圖片信息來(lái)制訂對(duì)應(yīng)的處理策略,從而避免侵犯別人的權(quán)利,所以其具有安全性高的優(yōu)點(diǎn)。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明第一較佳實(shí)施方式提供的一種網(wǎng)上信息抓取方法的流程圖;
圖2為本發(fā)明第二較佳實(shí)施方式提供的一種網(wǎng)上信息抓取系統(tǒng)的結(jié)構(gòu)圖。
圖3為本發(fā)明第二較佳實(shí)施方式提供的一種服務(wù)器的硬件結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請(qǐng)參考圖1,圖1是本發(fā)明第一較佳實(shí)施方式提出的一種網(wǎng)上信息抓取方法,該方法如圖1所示,包括如下步驟:
步驟S101、服務(wù)器接收用戶(hù)通過(guò)HTTP發(fā)送的信息抓取請(qǐng)求。
步驟S102、服務(wù)器從網(wǎng)絡(luò)中抓取與該抓取請(qǐng)求對(duì)應(yīng)的信息。
步驟S103、服務(wù)器依據(jù)該抓取請(qǐng)求對(duì)應(yīng)的信息內(nèi)包含的圖片信息確定該信息的處理策略。
本發(fā)明提供的技術(shù)方案通過(guò)抓取的信息是否包含圖片信息來(lái)制訂對(duì)應(yīng)的處理策略,從而避免侵犯別人的權(quán)利,所以其具有安全性高的優(yōu)點(diǎn)。
可選的,服務(wù)器如所述信息包含圖片信息,則將該信息存儲(chǔ),如所述信息不包含圖片信息,則將該信息分享。
可選的,服務(wù)器通過(guò)社交軟件或即時(shí)通信軟件對(duì)所述信息分享。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于深圳市博信諾達(dá)經(jīng)貿(mào)咨詢(xún)有限公司,未經(jīng)深圳市博信諾達(dá)經(jīng)貿(mào)咨詢(xún)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710149024.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





