[發(fā)明專利]基于專業(yè)搜索引擎的爬蟲策略獲取圖書信息的方法無效
| 申請?zhí)枺?/td> | 201310535962.2 | 申請日: | 2013-10-31 |
| 公開(公告)號: | CN104598493A | 公開(公告)日: | 2015-05-06 |
| 發(fā)明(設(shè)計)人: | 張宇 | 申請(專利權(quán))人: | 大連易維立方技術(shù)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 無 | 代理人: | 無 |
| 地址: | 116000 遼寧省大連市*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 專業(yè) 搜索引擎 爬蟲 策略 獲取 圖書 信息 方法 | ||
1.一種基于專業(yè)搜索引擎的爬蟲策略獲取圖書信息的方法,其特征在于包括如下步驟:
1)圖書信息收索服務(wù)器通過有線或無線的方式連接到各圖書網(wǎng)站上;
2)圖書信息收索服務(wù)器中存儲有對應(yīng)網(wǎng)站的數(shù)字許可證書,在圖書信息收索服務(wù)器登陸到上述網(wǎng)站后,自動匹配數(shù)字證書供網(wǎng)站校驗;
3)圖書網(wǎng)站校驗通過后,圖書信息收索服務(wù)器通過專業(yè)搜索引擎的爬蟲策略略對圖書網(wǎng)站中的更新圖書信息進行搜索,一旦搜索到圖書更新信息后,圖書信息收索服務(wù)器便對更新的圖書信息進行下載,下載的更新圖書信息經(jīng)過防火墻和數(shù)據(jù)過濾器后存入圖書信息收索服務(wù)器本地存儲器中;
4)圖書信息收索服務(wù)器對存儲如本地存儲器的圖書信息進行編譯,然后發(fā)送到圖書源數(shù)據(jù)庫中。
2.根據(jù)權(quán)利要求1所述的一種基于專業(yè)搜索引擎的爬蟲策略獲取圖書信息的方法,其特征在于步驟3)中:
所述圖書下載方式為通過專業(yè)搜索引擎的爬蟲策略略邊搜索邊下載。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連易維立方技術(shù)有限公司;,未經(jīng)大連易維立方技術(shù)有限公司;許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310535962.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)字化專業(yè)建設(shè)評估方法
- 一種適用于小型設(shè)計院進度控制的管理方法
- 一種行業(yè)管理及專業(yè)服務(wù)計算機系統(tǒng)
- 基于BIM的城市軌道交通車輛基地設(shè)計方法
- 一種垂直引導(dǎo)專業(yè)咨詢的方法、系統(tǒng)及電子設(shè)備
- 專業(yè)信息資源管理及交易系統(tǒng)
- 專業(yè)信息資源管理及交易系統(tǒng)
- 一種專業(yè)領(lǐng)域語料的中文分詞方法及裝置
- 一種學(xué)科專業(yè)評優(yōu)的方法和系統(tǒng)
- 基于BIM的城市軌道交通站臺門系統(tǒng)工程設(shè)計方法
- 檢測反爬蟲策略安全性的方法及裝置
- 一種監(jiān)控網(wǎng)絡(luò)爬蟲的方法、裝置和系統(tǒng)
- 一種通過爬蟲狀態(tài)機管理爬蟲的方法及裝置
- 爬蟲協(xié)議管理方法及裝置、爬蟲系統(tǒng)
- 基于APP客戶端的爬蟲及爬取方法
- 視頻業(yè)務(wù)處理方法、裝置及電子設(shè)備
- 一種爬蟲方法、裝置、系統(tǒng)、設(shè)備及可讀存儲介質(zhì)
- 分布式爬蟲系統(tǒng)架構(gòu)、爬取數(shù)據(jù)的方法和計算機設(shè)備
- 基于scrapy爬蟲框架的數(shù)據(jù)采集系統(tǒng)及方法
- 多中心綜合網(wǎng)絡(luò)爬蟲系統(tǒng)





