[發明專利]網頁獲取方法、裝置、計算機設備及存儲介質有效
| 申請號: | 201910323566.0 | 申請日: | 2019-04-22 |
| 公開(公告)號: | CN110221871B | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 范小明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F9/445 | 分類號: | G06F9/445;G06F16/955 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 黃晶晶 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁 獲取 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種網頁獲取方法、裝置、計算機設備及存儲介質,該方法包括:在容器中運行頁面獲取應用;所述頁面獲取應用,是安裝于所述容器的用于獲取頁面內容的應用程序;通過所述頁面獲取應用獲取目標網頁的鏈接地址;由所述頁面獲取應用,調用安裝于所述容器中的瀏覽器;通過所述瀏覽器,渲染與所述鏈接地址對應的所述目標網頁的頁面內容。本申請的方案,能夠提高網頁內容獲取的準確性。
技術領域
本發明涉及計算機技術領域,特別是涉及一種網頁獲取方法、裝置、計算機設備及存儲介質。
背景技術
隨著互聯網技術的飛速發展,越來越多的場景需要獲取網頁內容。比如,網頁爬蟲就需要爬取網頁內容。網頁內容的完整性,直接影響到相關結果的準確性,因此,獲取完整的網頁內容至關重要。
傳統方法在獲取網頁內容時,是使用HTTP協議請求網頁內容,這種方式所請求到的網頁內容,并未經過瀏覽器的解析計算,可能只包含部分數據。所以,導致獲取的網頁內容缺失比較多,造成所獲取的網頁內容不夠準確。
發明內容
基于此,有必要針對傳統網頁獲取方法存在的準確性比較低的問題,提供一種網頁獲取方法、裝置、計算機設備及存儲介質。
一種網頁獲取方法,所述方法包括:
在容器中運行頁面獲取應用;所述頁面獲取應用,是安裝于所述容器的用于獲取頁面內容的應用程序;
通過所述頁面獲取應用獲取目標網頁的鏈接地址;
由所述頁面獲取應用,調用安裝于所述容器中的瀏覽器;
通過所述瀏覽器,渲染與所述鏈接地址對應的所述目標網頁的頁面內容。
一種網頁獲取裝置,所述裝置包括:
獲取模塊,用于在容器中運行頁面獲取應用;所述頁面獲取應用,是安裝于所述容器的用于獲取頁面內容的應用程序;通過所述頁面獲取應用獲取目標網頁的鏈接地址;
調用模塊,用于由所述頁面獲取應用,調用安裝于所述容器中的瀏覽器;
渲染模塊,用于通過所述瀏覽器,渲染與所述鏈接地址對應的所述目標網頁的頁面內容。
一種計算機設備,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述計算機程序被所述處理器執行時,使得所述處理器執行如下步驟:
在容器中運行頁面獲取應用;所述頁面獲取應用,是安裝于所述容器的用于獲取頁面內容的應用程序;
通過所述頁面獲取應用獲取目標網頁的鏈接地址;
由所述頁面獲取應用,調用安裝于所述容器中的瀏覽器;
通過所述瀏覽器,渲染與所述鏈接地址對應的所述目標網頁的頁面內容。
一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時,使得所述處理器執行如下步驟:
在容器中運行頁面獲取應用;所述頁面獲取應用,是安裝于所述容器的用于獲取頁面內容的應用程序;
通過所述頁面獲取應用獲取目標網頁的鏈接地址;
由所述頁面獲取應用,調用安裝于所述容器中的瀏覽器;
通過所述瀏覽器,渲染與所述鏈接地址對應的所述目標網頁的頁面內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910323566.0/2.html,轉載請聲明來源鉆瓜專利網。





