[發明專利]網頁截圖生成方法、裝置、設備以及存儲介質在審
| 申請號: | 202011522198.1 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112596833A | 公開(公告)日: | 2021-04-02 |
| 發明(設計)人: | 賈宇飛 | 申請(專利權)人: | 北京鴻騰智能科技有限公司 |
| 主分類號: | G06F9/451 | 分類號: | G06F9/451 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 謝閱 |
| 地址: | 100020 北京市朝陽區酒*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁 截圖 生成 方法 裝置 設備 以及 存儲 介質 | ||
本發明公開一種網頁截圖生成方法、裝置、設備以及存儲介質,涉及互聯網技術領域。網頁截圖生成方法包括:在目標網頁加載完畢后,獲取目標網頁的原始頁面元素與預設關鍵元素;從所述原始頁面元素中識別與所述預設關鍵元素相關聯的目標頁面元素;在所述目標頁面元素中添加預設高亮標記,以獲得所述原始頁面元素更新后的結果頁面元素;基于所述結果頁面元素,渲染并生成所述目標網頁對應的網頁截圖。本發明可在截圖生成過程中直接生成高亮顯示預設關鍵元素的網頁截圖。
技術領域
本發明涉及互聯網技術領域,特別涉及一種網頁截圖生成方法、裝置、設備以及存儲介質。
背景技術
相關技術中,在廣告抓取業務中常常需要獲取到廣告截圖作為證據,現有的頁面截圖大多基于chromium實現代碼自動化截圖。
但是截圖的功能比較單一,對網頁界面中需要注意的顯示元素或者顯示區域還需要截圖后再執行額外操作。
發明內容
本發明的主要目的是提供一種網頁截圖生成方法、裝置、設備以及存儲介質,旨在解決現有技術中對網頁界面中需要注意的顯示元素或者顯示區域還需要截圖后再執行額外操作的技術問題。
為實現上述目的,本發明提出的一種網頁截圖生成方法,包括:
在目標網頁加載完畢后,獲取目標網頁的原始頁面元素與預設關鍵元素;
從所述原始頁面元素中識別與所述預設關鍵元素相關聯的目標頁面元素;
在所述目標頁面元素中添加預設高亮標記,以獲得所述原始頁面元素更新后的結果頁面元素;
基于所述結果頁面元素,渲染并生成所述目標網頁對應的網頁截圖。
可選的,所述獲取目標網頁的原始頁面元素與預設關鍵元素的步驟之前,所述方法還包括:
接收所述目標網頁的超文本標記語言HTML數據;
根據所述超文本標記語言HTML數據,加載所述目標網頁。
可選的,所述獲取目標網頁的原始頁面元素與預設關鍵元素的步驟之前,所述方法還包括:
響應于對目標網頁的訪問請求,獲取所述目標頁面的統一資源定位符URL;
根據所述URL加載所述目標網頁。
可選的,所述從所述原始頁面元素中識別與所述預設關鍵元素相關聯的目標頁面元素的步驟,包括:
從所述原始頁面元素對應的代碼數據中識別出具有所述預設關鍵元素的目標文本;
將具有所述目標文本的第一頁面元素識別為所述目標頁面元素。
可選的,所述在目標網頁加載完畢后,獲取目標網頁的原始頁面元素與預設關鍵元素的步驟之前,所述方法還包括:
滾動所述目標網頁至滿足預設條件,以觸發所述目標網頁的加載完畢事件,所述加載完畢事件為網頁內至少部分頁面元素加載完成后觸發的系統事件;
所述在目標網頁加載完畢后,獲取目標網頁的原始頁面元素與預設關鍵元素的步驟,包括:
在目標網頁的所述加載完畢事件加載完成后,獲取目標網頁的原始頁面元素與預設關鍵元素。
可選的,所述在所述目標頁面元素中添加預設高亮標記,以獲得所述原始頁面元素更新后的結果頁面元素的步驟,包括:
在所述目標頁面元素以及所述加載完畢事件對應的第二頁面元素中均添加預設高亮標記,以獲得所述原始頁面元素更新后的結果頁面元素。
可選的,所述預設條件包括:
從上至下滾動所述目標網頁至網頁底部;或者
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京鴻騰智能科技有限公司,未經北京鴻騰智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011522198.1/2.html,轉載請聲明來源鉆瓜專利網。





