[發明專利]網絡爬蟲在抓取網頁或數據時再過濾的方法在審
| 申請號: | 201310754635.6 | 申請日: | 2013-12-31 |
| 公開(公告)號: | CN103744944A | 公開(公告)日: | 2014-04-23 |
| 發明(設計)人: | 朱龍騰 | 申請(專利權)人: | 上海伯釋信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 201100 上海市閔行*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 爬蟲 抓取 網頁 數據 過濾 方法 | ||
1.一種網絡爬蟲在抓取網頁或數據時再過濾的方法,其特征在于它由以下步驟實現:
步驟一:輸入需要收索信息的關鍵詞;
步驟二:服務器收索URL的地址;
步驟三:從所收索URL地址中抓取目標網頁的信息;
步驟四:再次輸入二級收索關鍵詞;
步驟五:再次抓取網頁的信息;
步驟六:輸出目標信息。
2.根據權利要求書1所述網絡爬蟲在抓取網頁或數據時再過濾的方法,其特征在于:步驟二中所述服務器收索URL的地址之前對關鍵詞進行了分析,然后選擇的收索URL的地址。
3.根據權利要求書1所述網絡爬蟲在抓取網頁或數據時再過濾的方法,其特征在于:步驟三中所述從所收索URL地址中抓取目標網頁的信息以列表的形式顯示。
4.根據權利要求書1所述網絡爬蟲在抓取網頁或數據時再過濾的方法,其特征在于:步驟四中所述再次輸入二級收索關鍵詞為目標信息中更具體的描述性詞語。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海伯釋信息科技有限公司,未經上海伯釋信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310754635.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于北斗衛星的天然氣管道隱患排查系統和方法
- 下一篇:一種新型便于打理的鍵盤





