[發明專利]一種基于爬蟲的自動化差異檢測方法及裝置有效
| 申請號: | 201310250701.6 | 申請日: | 2013-06-21 |
| 公開(公告)號: | CN103365967B | 公開(公告)日: | 2017-02-08 |
| 發明(設計)人: | 孫彬;吳甜甜;范桂群;黃始韜 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F11/34 |
| 代理公司: | 北京銘碩知識產權代理有限公司11286 | 代理人: | 羅延紅,王占杰 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 爬蟲 自動化 差異 檢測 方法 裝置 | ||
技術領域
本發明涉及一種自動化差異檢測方法及裝置,更具體地說,涉及一種基于爬蟲的自動化差異檢測方法及裝置。
背景技術
互聯網上的Web系統經常會升級,有些升級僅影響了少數的頁面,由于頁面實現底層可能有耦合關系,為了保證整個Web系統的質量,測試人員往往需要回歸所有的頁面,人力消耗很大。
差異(Diff)檢測,是通過找出新舊系統的不同來進行回歸檢測的方法?,F有的Web檢測技術一般是通過瀏覽器驅動器操作頁面,通過對HTML頁面進行分析,定義一些斷言的方式進行web自動化檢測。例如,selenium、watir框架可提供這種web自動化檢測方法。
上述方案需要人工開發測試用例,但頁面變化時,經常導致用例不可用,需要更新維護,人力成本較大;上述方案一般對頁面的代碼進行分析,如果不符合預期即認為是bug,而Web服務最終展現給用戶的是可視化的頁面,上述方案無法對頁面的可視化效果進行驗證;上述方案只能對指定的點進行驗證。因此,為了減少人力成本,需要一種自動找出變化和不變的頁面,同時保證回歸檢測的效率和質量的差異檢測方法。
發明內容
本發明提供了一種自動化差異檢測方法及裝置。該方法可以對新舊兩套Web系統進行自動化測試,快速產生差異測試報告,幫助用戶直觀準確地定位有差異的部分。
根據本發明示例性實施例的一方面,提供了一種基于爬蟲的自動化差異檢測方法,所述方法包括:獲取第一Web系統的第一初始統一資源定位符(URL)以及第二Web系統的第二初始URL;基于爬蟲分別對第一初始URL和第二初始URL進行遍歷,以不斷抓取第一web系統下的第一頁面和第二web系統下的第二頁面,其中,在遍歷過程中,執行以下處理:對抓取的第一頁面和相應的第二頁面進行渲染,分別產生第一網頁圖像和第二網頁圖像,對第一網頁圖像和第二網頁圖像進行相似性比較,當第一網頁圖像和第二網頁圖像不同時,產生差異頁面信息,并且將所述差異頁面信息存儲在差異頁面信息數據庫中。
所述差異頁面信息可包括指示所述第一網頁圖像與所述第二網頁圖像不同的圖像。
所述差異頁面信息還可包括與所述第一網頁圖像對應的第一網頁的URL和與所述第二網頁圖像對應的第二網頁的URL,和/或與所述第一網頁圖像對應的第一網頁和與所述第二網頁圖像對應的第二網頁。
進行相似性比較的步驟可包括:將第一網頁圖像與相應的第二網頁圖像分別轉換為第一灰度圖像和第二灰度圖像;逐個比較第一灰度圖像和第二灰度圖像中的每個像素;如果第一灰度圖像和第二灰度圖像的不同像素數量超過預定閾值,則確定第一網頁圖像與相應的第二網頁圖像不同。
可使用第一灰度圖像中的與第二灰度圖像不同的像素來產生所述差異頁面信息。
在所述遍歷過程中,可跳過第一Web系統下的非本地URL和第二Web系統下的非本地URL。
如果第一Web系統下的本地URL的后綴與第二Web系統下的相應的本地URL的后綴相同,則可確定所述第一Web系統下的本地URL與所述第二Web系統下的相應的本地URL相同。
在所述遍歷過程中,如果從第一頁面中提取的URL與從第二頁面中提取的相應的URL不相同,則可跳過所述從第一頁面中提取的URL和所述從第二頁面中提取的相應的URL,并可產生差異頁面信息,將差異頁面信息存儲在差異頁面信息數據庫中。
所述差異頁面信息可包括所述第一頁面的URL和所述第二頁面的URL,和/或所述第一頁面和所述第二頁面。
所述方法還可包括:從差異頁面信息數據庫讀取差異頁面信息,根據所述差異頁面信息產生相應的報告。
根據本發明示例性實施例的一方面,提供了一種基于爬蟲的自動化差異檢測裝置,所述裝置包括:URL獲取單元,獲取第一Web系統的第一初始統一資源定位符(URL)以及第二Web系統的第二初始URL;遍歷比較單元,基于爬蟲分別對第一初始URL和第二初始URL進行遍歷,以不斷抓取第一頁面和第二頁面,其中,在遍歷過程中,執行以下處理:對抓取的第一頁面和相應的第二頁面進行渲染,分別產生第一網頁圖像和第二網頁圖像,對第一網頁圖像和第二網頁圖像進行相似性比較,當第一網頁圖像和第二網頁圖像不同時,產生差異頁面信息,并且將所述差異頁面信息存儲在差異頁面信息數據庫中。
所述裝置還可包括報告產生單元,從差異頁面信息數據庫讀取差異頁面信息,根據所述差異頁面信息產生相應的報告。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310250701.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種商務旅行車用車載冰箱
- 下一篇:封裝片沖壓模具





