[發明專利]網頁預讀取方法及系統有效
| 申請號: | 201210265609.2 | 申請日: | 2012-07-27 |
| 公開(公告)號: | CN103577439B | 公開(公告)日: | 2017-02-08 |
| 發明(設計)人: | 胡又歡 | 申請(專利權)人: | 北京搜狗信息服務有限公司;北京搜狗科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京華沛德權律師事務所11302 | 代理人: | 馬苗苗 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁 讀取 方法 系統 | ||
技術領域
本發明涉及瀏覽器技術領域,特別是涉及網頁預讀取方法及系統。
背景技術
用戶經常使用瀏覽器來訪問各種網站,但是網絡訪問速度受各種因素影響,可能用戶客戶端自身連接速度受限制,或是所訪問的網站服務端帶寬受限制,使得用戶在訪問網頁時,需要等待一段時間,才能夠將網頁完全展現在用戶面前。然而,用戶總是希望獲得更快的訪問速度,不想把時間浪費在等待網頁打開上。
為了提高網頁訪問速度,現有技術中出現了預讀取技術,所謂的預讀取是指,預先從后臺對當前打開的網頁中包含的鏈接指向的目標網頁進行讀取,并緩存在計算機本地,這樣,當用戶真正點擊鏈接訪問某對應的目標網頁時,只需要從用戶計算機本地的緩存中讀取頁面并進行相應的展現即可,從而達到提高訪問速度的目的。
然而在實際應用中,對哪些網頁進行預讀取是需要考慮的問題。因為如果當前打開的網頁中包含有大量的鏈接,如果對每條鏈接對應的目標網頁都進行預讀取,則需要耗費非常多的下載、存儲等系統資源。然而,實際上用戶可能并不是對當前打開的網頁中包含的所有鏈接都進行點擊訪問,這就會造成以下結果:預讀取了大量網頁,而用戶實際訪問的可能只有其中的少數幾個網頁,其他未被用戶訪問但已經進行了預讀取的網頁,對其進行預讀取時所耗費的系統資源而言是一種浪費。
因此,如何提高預讀取的有效性,降低對系統資源的浪費,是迫切需要本領域技術人員解決的技術問題。
發明內容
本發明提供了網頁預讀取方法及系統,能夠提高預讀取的有效性,降低對系統資源的浪費。
本發明提供了如下方案:
一種網頁預讀取方法,包括:
記錄用戶在網頁上的瀏覽行為信息;
根據所述瀏覽行為信息確定該用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接;
當用戶下次訪問該網頁時,將所述已經瀏覽過其錨信息但未被該用戶點擊的鏈接對應的目標網頁排除在預讀取的范圍之外。
可選的,所述記錄用戶在網頁上的瀏覽行為信息包括:
記錄用戶在網頁上點擊的鏈接;
所述根據所述瀏覽行為信息確定該用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接包括:
根據所述用戶在網頁上點擊的鏈接,確定該用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接。
可選的,所述根據所述用戶在網頁上點擊的鏈接,確定該用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接包括:
獲取網頁中的各個鏈接在網頁中的位置信息;
將與被點擊鏈接相鄰的前N1個鏈接以及后N2個鏈接,確定為用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接,其中,N1與N2為預置的固定值。
可選的,所述記錄用戶在網頁上的瀏覽行為信息還包括:
記錄在網頁上的停留時間和/或網頁滾動信息;
所述根據所述用戶在網頁上點擊的鏈接,確定該用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接包括:
獲取網頁中的各個鏈接在網頁中的位置信息;
將與被點擊鏈接相鄰的前N1個鏈接以及后N2個鏈接,確定為用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接,其中,N1與N2的取值根據在網頁上的停留時間和/或網頁滾動信息確定。
可選的,在根據所述用戶在網頁上點擊的鏈接,確定該用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接之前,還包括:
判斷在網頁上點擊的鏈接是否為網頁的主要內容列表中的鏈接,如果是,則觸發執行所述根據所述用戶在網頁上點擊的鏈接,確定用戶已經瀏覽過其錨信息但未被該用戶點擊的鏈接的步驟。
可選的,所述判斷在網頁上點擊的鏈接是否為網頁的主要內容列表中的鏈接包括:
根據被點擊鏈接在網頁的文檔對象模型中的位置,查找被點擊鏈接的父節點;
判斷所述父節點下是否包含與所述被點擊鏈接結構相似的子節點;
如果是,統計所述父節點下各個子節點對應的鏈接錨文本的平均長度值;
如果所述平均長度值大于預置的閾值,則確定在網頁上點擊的鏈接為網頁的主要內容列表中的鏈接。
可選的,還包括:
獲取網頁所屬的類別信息;
如果該網頁屬于預置的類別,則當用戶下次訪問該網頁時,將所述用戶在網頁上點擊的鏈接對應的目標網頁排除在預讀取的范圍之外。
可選的,如果用戶在網頁中沒有執行點擊行為,則所述記錄用戶在網頁上的瀏覽行為信息包括:
記錄在網頁上的停留時間和/或頁面滾動信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗信息服務有限公司;北京搜狗科技發展有限公司,未經北京搜狗信息服務有限公司;北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210265609.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種快速丟棄垃圾裝置
- 下一篇:包裝結構





