[發明專利]一種反爬蟲方法、服務器和客戶端有效
| 申請號: | 201810118999.8 | 申請日: | 2018-02-06 |
| 公開(公告)號: | CN108449316B | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 蘇思洋;李濤 | 申請(專利權)人: | 麒麟合盛網絡技術股份有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L29/08 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 100085 北京市海淀區信息路2號(北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 爬蟲 方法 服務器 客戶端 | ||
本申請公開了一種反爬蟲方法、服務器和客戶端,所述方法包括:在服務器中,根據預設亂序規則,對原始數據進行亂序處理,得到與原始數據對應的亂序數據,以及確定與預設亂序規則對應的亂序標識,其中,亂序標識用于在客戶端進行網頁展示時將亂序數據轉換為原始數據;根據亂序數據和亂序標識,生成與亂序數據對應的網頁源碼;在接收到客戶端發送的網頁訪問請求后,向客戶端返回網頁源碼,以供客戶端展示原始數據,使得在客戶端被爬蟲爬取時,爬蟲獲取到的網頁源碼中為亂序數據,而客戶端展示給用戶的為亂序數據所對應的原始數據,從而既能夠避免原始數據的泄漏,又不影響用戶的正常瀏覽,有效提高了網站安全性能。
技術領域
本申請涉及信息安全技術領域,尤其涉及一種反爬蟲方法、服務器和客戶端。
背景技術
網絡爬蟲(簡稱爬蟲),是一種通過網頁的鏈接地址尋找網頁,并按照一定的規則,自動獲取網頁內容的程序。
目前的爬蟲技術已經很普遍,通過設定的規則,爬蟲可以輕易地抓取網頁源碼中一些重要信息,例如,商品價格、商家電話號碼、商品評分或商品關鍵參數等,造成網站信息泄漏,降低網站安全性能。
發明內容
本申請實施例提供一種反爬蟲方法、服務器和客戶端,用以解決現有的爬蟲爬取造成的網站信息泄漏問題。
本申請實施例提供了一種反爬蟲方法,所述方法應用于服務器,所述方法包括:
根據預設亂序規則,對原始數據進行亂序處理,得到與所述原始數據對應的亂序數據;
確定與所述預設亂序規則對應的亂序標識,其中,所述亂序標識用于在客戶端進行網頁展示時將所述亂序數據轉換為所述原始數據;
根據所述亂序數據和所述亂序標識,生成與所述亂序數據對應的網頁源碼;
在接收到所述客戶端發送的網頁訪問請求后,向所述客戶端返回所述網頁源碼,以供所述客戶端展示所述原始數據。
可選地,在根據預設亂序規則,對原始數據進行亂序處理,得到與所述原始數據對應的亂序數據之前,所述方法還包括:
根據所述原始數據,隨機生成所述預設亂序規則;
確定與所述預設亂序規則對應的亂序標識,包括:
確定所述預設亂序規則對應的哈希值;
將所述哈希值確定為所述亂序標識。
可選地,根據所述亂序數據和所述亂序標識,生成與所述亂序數據對應的網頁源碼,包括:
將所述亂序標識確定為與所述亂序數據對應的標簽的屬性值。
本申請實施例還提供一種反爬蟲方法,所述方法應用于客戶端,所述方法包括:
向服務器發送用于訪問目標網頁的網頁訪問請求;
接收所述服務器返回的與所述目標網頁對應的網頁源碼;
根據所述網頁源碼中與亂序數據對應的亂序標識,將所述亂序數據轉換為原始數據,其中,所述亂序數據是在所述服務器中對所述原始數據進行亂序處理之后得到的;
根據所述原始數據,生成所述目標網頁。
可選地,根據所述網頁源碼中與亂序數據對應的亂序標識,將所述亂序數據轉換為原始數據,包括:
將所述亂序數據對應的標簽的屬性值,確定為與所述亂序數據對應的亂序標識。
根據所述亂序標識,從服務器獲取與所述亂序標識對應的預設亂序規則;
根據所述預設亂序規則,將所述亂序數據轉換為所述原始數據。
本申請實施例還提供一種服務器,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于麒麟合盛網絡技術股份有限公司,未經麒麟合盛網絡技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810118999.8/2.html,轉載請聲明來源鉆瓜專利網。





