[發明專利]一種通過隨機代碼注入防止網頁數據未經授權抓取的方法在審
| 申請號: | 201611271568.2 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN108256347A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 孫翔 | 申請(專利權)人: | 孫翔 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 抓取 標簽集合 動態頁面 隨機代碼 網頁數據 用戶體驗 客戶端 內容發送服務器 頁面訪問請求 用戶客戶端 內容生成 系統執行 頁面返回 預先分析 真正用戶 中文字符 授權 網頁 移植 再生 | ||
本發明公開了一種通過隨機代碼注入防止網頁數據未經授權抓取的方法,其特征在于,包括客戶端和WEB服務器,客戶端向WEB服務器發出頁面訪問請求,WEB服務器生成正常的動態頁面,動態頁面內容生成后利用將內容發送服務器RID模塊,生成HTML標簽<table></table>,再生成<tr></tr>標簽對組,生成<tr></tr>標簽對組后將該標簽對組插入<table></table>之間,最后生成標簽集合,RID系統將該標簽集合隨機插入到預先分析出的網頁有效中文字符之間,并將插入后的頁面返回給用戶客戶端。該方法易于實現,易于移植,執行效率高,不影響生成頁面的用戶體驗,該方案隨機表格標簽集生成容易,實現代碼簡單,系統執行效率高,對真正用戶的用戶體驗沒有任何影響。
技術領域
本發明涉及計算機數據安全領域,具體是一種通過隨機代碼注入防止網頁數據未經授權抓取的方法。
背景技術
隨著計算機信息技術的發展,越來越多的企業建立了自己的網站,這些網站不是一個個信息孤島,它們之間常常存在一種信息交流,其中有些企業在開發使用第三方數據的企業站點時采取的是謹慎的態度,它們通常的做法是和第三方數據提供者簽署書面法律文件并給予對方適當的回報來獲得對方數據的訪問授權,另一些公司做法正好相反,它們試圖在未獲取對方許可的情況下免費使用第三方數據;這些公司一般使用自動化網絡爬取工具大量爬取它們需要的數據,這種行為嚴重損壞了第三方公司的合法權益,給對方的網絡增加了大量的額外負載。
發明內容
本發明的目的在于提供一種通過隨機代碼注入防止網頁數據未經授權抓取的方法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:
一種通過隨機代碼注入防止網頁數據未經授權抓取的方法,包括客戶端和WEB服務器,客戶端向WEB服務器發出頁面訪問請求,WEB服務器生成正常的動態頁面,動態頁面內容生成后利用將內容發送服務器RID模塊,RID模塊分析網頁,通過判斷所讀取的文本所屬的字符集,然后生成HTML標簽<table></table>,再生成<tr></tr>標簽對組,生成的<tr></tr>標簽對組的數量由RID模塊隨機確定,生成<tr></tr>標簽對組后將該標簽對組插入<table></table>之間,RID模塊再為每個生成的<tr></tr>標簽對生成隨機數量的<td></td>標簽對組并插入到<tr></tr>標簽對之間,最后生成標簽集合,RID系統將該標簽集合隨機插入到預先分析出的網頁有效中文字符之間,并將插入后的頁面返回給用戶客戶端。
作為本發明進一步的方案:所述RID模塊豐要包括隨機代碼生成模塊以及隨機代碼插入模塊。
作為本發明再進一步的方案:所述WEB服務器豐要是由RID模塊與動態頁面生成模塊構成。
與現有技術相比,本發明的有益效果是:該方法易于實現,易于移植,執行效率高,不影響生成頁面的用戶體驗。因為該方案實現時遵循了HTML、Servlet標準,只要是JEE兼容的WEB容器皆可以直接移植代碼模塊功能,隨機表格標簽集生成容易,實現代碼簡單,系統執行效率高,由于隨機表格標簽集其實質是一張空表,用戶瀏覽器在渲染用戶界面時直接予以忽略,對真正用戶的用戶體驗沒有任何影響。
附圖說明
圖1為通過隨機代碼注入防止網頁數據未經授權抓取的方法的結構示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于孫翔,未經孫翔許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611271568.2/2.html,轉載請聲明來源鉆瓜專利網。





