[發明專利]一種Web深網查詢接口檢測方法有效
| 申請號: | 201810971193.3 | 申請日: | 2018-08-24 |
| 公開(公告)號: | CN109086450B | 公開(公告)日: | 2021-08-27 |
| 發明(設計)人: | 于富財;涂軼文;章俊;費高雷 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/958;G06F8/72 |
| 代理公司: | 成都虹盛匯泉專利代理有限公司 51268 | 代理人: | 王偉 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 web 查詢 接口 檢測 方法 | ||
1.一種Web深網查詢接口檢測方法,其特征在于,包括以下步驟:
S1、輸入網頁URL鏈接地址;
S2、進行網頁渲染,通過布局渲染引擎,將HTML可視標簽的顯示方式轉化為盒模型;
S3、進行布局分塊;
S4、進行分塊剪枝;具體實現方法為:
S41、選擇布局分塊結果集合中的一個分塊,判斷該分塊是否具有接口元素,若是則保留該分塊,并將該分塊標記為已處理;否則執行步驟S42;
S42、判斷該分塊與Web頁面底部的距離是否小于預設的閾值,若是則刪除該分塊,否則執行步驟S43;
S43、判斷該分塊盒模型對應的DOM樹模型的子節點集合中是否包含文本節點,若是則執行步驟S44,否則刪除該分塊;
S44、判斷該分塊的圖形元素密度是否大于預設的比例系數γ1,若是則刪除該分塊,否則進一步判斷該分塊的鏈接密度是否大于預設的閾值γ2,若是則刪除該分塊,否則保留該分塊并將該分塊標記為已處理,其中,0≤γ1≤1,0≤γ2≤1;
S45、檢查布局分塊集合中是否存在未處理的分塊,若是則返回步驟S41,否則輸出布局分塊集合中的所有分塊集合;
S5、進行分塊重構;
S6、輸出交互接口。
2.根據權利要求1所述的一種Web深網查詢接口檢測方法,其特征在于,所述步驟S3進行布局分塊的規則為:
(1)如果分塊EB對應的HTML元素標簽為form,則當前分塊不劃分;
(2)如果分塊EB的接口元素密度低于預設的閾值,則當前分塊需要劃分;否則進一步判斷當前分塊所包含的區域是否含有多個交互接口區域,若是則當前分塊需要劃分,否則當前分塊不劃分;
(3)如果分塊EB存在背景顏色不同的子分塊,則劃分當前分塊;
(4)如果分塊EB存在分隔符子分塊,則以分隔符為界劃分當前分塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810971193.3/1.html,轉載請聲明來源鉆瓜專利網。





