[發明專利]保存網頁完整內容的方法、系統及相應的客戶端和服務器有效
| 申請號: | 201210578711.8 | 申請日: | 2012-12-27 |
| 公開(公告)號: | CN103902571B | 公開(公告)日: | 2017-09-01 |
| 發明(設計)人: | 程亮;潘農菲;安婷婷;谷琦 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/08 |
| 代理公司: | 北京德琦知識產權代理有限公司11018 | 代理人: | 張曉峰,宋志強 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 保存 網頁 完整 內容 方法 系統 相應 客戶端 服務器 | ||
技術領域
本申請涉及網頁數據處理技術領域,尤其涉及一種保存網頁完整內容的方法、系統及相應的客戶端和服務器。
背景技術
網絡瀏覽器簡稱瀏覽器,是指萬維網(Web)服務的客戶端瀏覽程序,瀏覽器在訪問網頁時,可以向Web服務器發送各種請求,并對從服務器發來的超文本信息和各種多媒體數據格式進行解析、顯示和播放,從而將網頁展示在終端屏幕上。
用戶在通過瀏覽器訪問網頁時,往往希望能把當前瀏覽的網頁的完整內容保存下來,在以后希望重新瀏覽該網頁時,即使不訪問該網頁的發布服務器也可以正常瀏覽該網頁的完整內容。為了滿足這一需求,現有的大部分瀏覽器都有將當前瀏覽的網頁的完整內容保存在本地終端(如計算機或移動終端)上的功能。
但是目前隨著各種電子終端的普及,用戶往往會擁有多個具有數據處理功能的電子終端,并可采用各個電子終端上的瀏覽器網瀏覽網頁。例如在辦公室使用臺式計算機瀏覽網頁,在家里使用筆記本電腦瀏覽網頁,外出時又使用移動終端(例如智能手機、掌上電腦、平板電腦等)瀏覽網頁,如果還是將當前瀏覽的網頁的完整內容只保存在本地終端,那么當用戶更換電子終端后,由于當前電子終端本地中沒有保存網頁,因此用戶需要重新瀏覽該網頁時,還需要訪問該網頁的發布服務器才可以正常瀏覽到該網頁的完整內容,如果該發布服務器出現問題則無法再次瀏覽該網頁。
為了解決這個問題,目前出現了一種在云端保存網頁完整內容的技術方案,例如Evernote云端筆記系統。該技術方案中包括云端服務器和客戶端,所述客戶端作為計算機(PC)瀏覽器的插件安裝在計算機瀏覽器上,用于對該計算機當前瀏覽的網頁的完整內容(包括具體內容信息和樣式信息)進行直接提取,并轉換成所述云端服務器要求的指定格式的文件,該指定格式的文件中包含了網頁的排版內容、樣式信息、圖片資源數據這些構成網頁的完整內容;轉換完畢后,再將該指定格式的文件上傳到云端服務器進行保存,用戶可以憑借帳號來訪問該云端服務器。在用戶以后希望重新瀏覽保存過的具有完整內容的網頁時,不需要再訪問該網頁的發布服務器,而是登錄所述云端服務器,訪問該云端服務器中保存的網頁即可。這樣即使該網頁的發布服務器出現問題也可以再次瀏覽該網頁的完整內容,而且不必受到終端的限制,例如用戶利用辦公室電腦將網頁保存到云端服務器,在家里使用筆記本電腦同樣可以訪問到該云端服務器中保存的網頁。
但是上述技術方案只能適用于計算機即桌面平臺,無法適用于機器性能很差的移動終端即移動平臺,例如智能手機、掌上電腦、平板電腦等,因為所述客戶端的轉換工作對機器資源的開銷太大,將上述技術方案直接移植到移動終端上,即直接將所述客戶端安裝在移動終端上,且采用現有方法對網頁進行提取轉換,會導致移動終端資源開銷大、運行效率低的技術問題;同時,由于網頁的所有內容(包括所有的文字和圖片資源)的提取和轉換工作在客戶端完成,并且要將所有內容由客戶端上傳到云端服務器,因此會耗費大量的網絡帶寬資源,而移動終端的網絡帶寬資源又是相對稀少且昂貴的。
發明內容
有鑒于此,本發明的主要目的在于提供一種保存網頁完整內容的方法、系統及相應的客戶端和服務器,可以實現利用移動終端將網頁的完整內容高效、快速地保存到云端服務器,同時又可以節約移動終端的機器資源開銷和網絡帶寬資源。
本發明的技術方案是這樣實現的:
一種保存網頁完整內容的方法,包括:
客戶端獲取瀏覽器所解析的當前所展示網頁的文檔對象模型DOM樹;并獲取該網頁的所有非內聯樣式數據;
客戶端遍歷所述DOM樹,將所述非內聯樣式數據轉換成所述DOM樹中每個DOM元素的內聯樣式數據,并將轉換后的內聯樣式數據保存在對應DOM元素的自定義屬性中;
客戶端將所述經過轉換處理的DOM樹上傳到中轉服務器;
中轉服務器接收客戶端上傳的所述經過轉換處理的DOM樹;
中轉服務器根據所述經過轉換處理的DOM樹中的圖片標簽抓取網頁中的圖片數據;
中轉服務器按照云端服務器要求的格式,將所述DOM樹和抓取到的圖片數據轉換成該云端服務器所要求的格式文件;
中轉服務器將所述轉換后的格式文件上傳到所述云端服務器保存。
一種保存網頁完整內容的系統,該系統包括客戶端和中轉服務器;
所述客戶端包括第一模塊、第二模塊和第三模塊;
所述第一模塊用于獲取瀏覽器所解析的當前所展示網頁的文檔對象模型DOM樹;并獲取該網頁的所有非內聯樣式數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210578711.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多功能電機入廠檢測試驗臺
- 下一篇:一種斷路器半自動延時檢測裝置
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





