[發明專利]基于移動瀏覽器的網頁處理方法及系統有效
| 申請號: | 201310744595.7 | 申請日: | 2013-12-30 |
| 公開(公告)號: | CN103761257B | 公開(公告)日: | 2017-09-22 |
| 發明(設計)人: | 梁捷;董洲 | 申請(專利權)人: | 優視科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鴻元知識產權代理有限公司11327 | 代理人: | 陳英俊,龔潔 |
| 地址: | 100080 北京市海淀區蘇州街2*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 移動 瀏覽器 網頁 處理 方法 系統 | ||
技術領域
本發明涉及移動瀏覽器技術領域,更為具體地,涉及一種基于移動瀏覽器的網頁處理方法及系統。
背景技術
隨著網絡的高速發展,人們通過訪問網站,可以隨時隨地獲取自己想要的資訊或者服務。在目前的網站建設過程中,大多數的中小型網站都采用模板系統搭建而成,例如視頻網站、小說網站等。
但是,采用模板系統搭建而成的網站會不可避免地存在以下問題:由于廣告是網站的主要營收手段,因此,采用模板系統所搭建的網站廣告多,使網站頁面不清爽,這是其一;其二,由于網站采用模板系統搭建而成,即使是不同的網站也有可能采用同一模板系統,因此,采用同一模板系統生成的網站,其用戶界面結構基本一致,相似度如此高的網站不利于用戶的體驗;其三,為了搜索引擎優化,方便爬蟲的抓取和收錄,采用模板系統搭建的網站均采用偽靜態化的頁面,造成網站承受力低、偽靜態頁面和動態頁面重復等,并且網站數據的更新也非實時更新,而是使用定時更新或者手動后臺更新,造成數據更新不及時等問題。
針對上述采用模板系統搭建而成的網站所存在的問題,現有的處理方法是基于域名進行判斷,即直接把網站的網址加到域名白名單中。其中,一個域名白名單對應一個網頁。用戶在訪問網站時,服務器只要判斷出用戶所請求訪問的網址存在于白名單中,即可將進行單獨轉碼后的新頁面提供給用戶。
然而,由于采用模板系統所搭建的網站會經常發生域名變換,因此,在基于域名白名單方式進行轉碼時,一旦網站的域名發生變化,那么該網站的網址就不會在白名單中出現,服務器也就不會對該網站進行轉碼轉換并生成新的頁面提供給用戶。如果要保證服務器能將網站進行轉碼并生成新的頁面提供給用戶,則需要人工及時更新域名白名單,這不僅工作效率低、人工維護成本高,并且用戶的體驗也不好。
發明內容
鑒于上述問題,本發明的目的是提供一種基于移動瀏覽器的網頁處理方法及系統,以解決服務器在使用模板系統所搭建的網站進行轉碼并生成新頁面提供給用戶時,受域名白名單影響的問題,降低網站的維護成本,提高工作效率和用戶體驗。
根據本發明的一個方面,提供一種基于移動瀏覽器的網頁處理方法,包括:
根據用戶發送的網站訪問請求中所含有的該網站的更新時間參數,確定網站的結構類型;其中,
當確定網站的結構類型為偽靜態網站時,通過判斷偽靜態網站中的偽靜態網頁的head標簽下的title標簽和meta標簽是否含有預設的關鍵字,確定偽靜態網站中的偽靜態網頁是否符合重建要求;其中,當偽靜態網頁的head標簽下的title標簽和meta標簽含有預設的關鍵字時,確定所述偽靜態網頁符合重建要求;
當偽靜態網頁符合重建要求時,抽取網頁元素白名單中含有的偽靜態網頁的核心元素,并根據所抽取的核心元素,對偽靜態網頁進行轉碼重建。
其中,在根據用戶發送的網站訪問請求中所含有的該網站的更新時間參數確定網站的結構類型的過程中,中間件截獲用戶發送的網站訪問請求,當網站訪問請求中含有Last Modified參數時,即確定網站的結構類型為偽靜態網站;或者,中間件截獲用戶發送的網站訪問請求,通過調用JS接口的document.lastmodified參數獲取網站服務器的最后更新時間,如果網站服務器的最后更新時間不是當前時間,則確定網站的結構類型為偽靜態網站。
其中,網頁元素白名單由偽靜態網頁的標簽下的核心元素構成,其中,標簽包括body標簽中的div標簽和/或table標簽。
根據本發明的另一方面,提供一種基于移動瀏覽器的網頁處理系統,包括:
網站結構類型確定單元,用于根據用戶發送的網站訪問請求中所含有的該網站的更新時間參數,確定網站的結構類型;
網頁重建確定單元,用于當網站結構類型確定單元,確定網站的結構類型為偽靜態網站時,通過判斷偽靜態網站中的偽靜態網頁的head標簽下的title標簽和meta標簽是否含有預設的關鍵字,確定偽靜態網站中的偽靜態網頁是否符合重建要求;其中,當偽靜態網頁的head標簽下的title標簽和meta標簽含有預設的關鍵字時,確定偽靜態網頁符合重建要求;
網頁核心元素抽取單元,用于當網頁重建確定單元確定偽靜態網頁符合重建要求時,抽取網頁元素白名單中含有的偽靜態網頁的核心元素;
頁面重建單元,用于根據核心元素抽取單元所抽取的核心元素,對偽靜態網頁進行轉碼重建。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于優視科技有限公司,未經優視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310744595.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:抗干擾數字移動廣播信號傳輸方法
- 下一篇:一種采用長短葉片旋流泵水力設計方法





