[發明專利]一種提高網頁訪問速度的方法及裝置無效
| 申請號: | 201010128121.6 | 申請日: | 2010-03-08 |
| 公開(公告)號: | CN101777081A | 公開(公告)日: | 2010-07-14 |
| 發明(設計)人: | 闞光遠 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04M1/725 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 李健;龍洪 |
| 地址: | 518057廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提高 網頁 訪問 速度 方法 裝置 | ||
技術領域
本發明涉及移動通訊技術領域,尤其涉及一種提高網頁訪問速度的方法及裝置。
背景技術
隨著3G(第三代移動通訊技術)時代的到來,手機互聯網用戶的數量逐漸增加,用戶對手機瀏覽器的速度要求也越來越高,但是由于手機瀏覽器受到手機信號和實時帶寬限制等條件的制約,用戶在使用手機瀏覽器時服務質量得不到保證。
現在的手機瀏覽器一般都使用緩沖機制,它利用網頁瀏覽的時間局部性,將曾經訪問過的文檔保存在手機瀏覽器緩存中,從而避免向遠程服務器發送請求,或者避免由遠程服務器發送完整的響應。
單純的Cache(高速緩沖存儲器)技術只是利用了網頁瀏覽模式的時間局部性,對于未曾訪問過的內容無法緩沖,響應性能依然得不到改善,這一點在用戶發現一個新的熱點服務器或服務器的頁面經常更新時,感覺尤其明顯。
另外,由于手機瀏覽器用于網頁內容緩沖的空間不大,曾經訪問過的內容被覆蓋,單純的Cache機制也不會產生好的響應性能,如何有效的提高手機瀏覽器訪問速度已經成為各種瀏覽器廠家目前最為關注的問題。
發明內容
本發明要解決的問題在于提供一種提高網頁訪問速度的方法及裝置,實現提高瀏覽網頁的速度,以進一步提高用戶體驗。
為了解決上述技術問題,本發明的一種提高網頁訪問速度的方法,包括:
讀取所保存的歷史網頁數據,得到頁面集合,從該頁面集合的頁面中抽取詞干,將詞干切分為詞條,得到與頁面對應的詞條集合;
從頁面集合的頁面中提取該頁面中的鏈接點,得到與頁面對應的鏈接點集合,并提取鏈接點的鏈接詞干,進行詞干切分,得到與鏈接點對應的鏈接詞條集合;
生成頁面集合中頁面對應的詞條集合中詞條之間的興趣關聯規則,或頁面集合中頁面對應的詞條集合與鏈接詞條集合中詞條之間的興趣關聯規則,興趣關聯規則的組合構成興趣關聯規則數據庫;
根據用戶當前訪問的頁面和興趣關聯規則,從該用戶當前訪問的頁面對應的鏈接點集合中預測出該用戶下一步進入的鏈接點,下載并緩存該鏈接點的網頁數據。
進一步地,詞條采用二元組的方式表示,在二元組中記錄詞條及該詞條的權重,該權重等于詞條的新鮮度乘以該詞條出現的頻度。
進一步地,生成頁面集合中頁面對應的詞條集合中詞條之間的興趣關聯規則的方法包括:
遍歷頁面集合,對任一已存頁面遍歷該頁面的鏈接點集合,逐一判斷各鏈接點的目標頁面是否屬于頁面集合,如果屬于,則遍歷已存頁面和目標頁面的詞條集合,進行詞條組合,計算兩個詞條的關聯支持度,得到詞條之間的興趣關聯規則,關聯支持度等于兩個詞條的權重之和,當詞條在多個頁面中重復出現時,則相應地在關聯支持度中累加兩個詞條的權重。
進一步地,生成頁面集合中頁面對應的詞條集合與鏈接詞條集合中詞條之間的興趣關聯規則的方法包括:
如果目標頁面不屬于頁面集合,則遍歷已存頁面的詞條集合及鏈接詞條集合,進行詞條組合,計算兩個詞條的關聯支持度,得到詞條之間的興趣關聯規則,關聯支持度等于已存頁面中詞條的權重,當鏈接詞條在多個鏈接詞條集合中出現時,則在關聯支持度中相應地累加已存頁面中詞條的權重。
進一步地,根據用戶當前訪問的頁面和興趣關聯規則,從該用戶當前訪問的頁面對應的鏈接點集合中預測出該用戶下一步進入的鏈接點的方法包括:
在興趣關聯規則數據庫中查找用戶當前訪問的頁面對應的詞條集合與鏈接詞條集合中的詞條之間的興趣關聯規則,計算轉移度,該轉移度等于該用戶當前訪問的頁面對應的詞條集合中的詞條的權重×所查找到的興趣關聯規則中的關聯支持度,完成轉移度的計算后,對所得到的全部的轉移度進行排序,轉移度最大的鏈接點為該用戶下一步進入的鏈接點。
進一步地,興趣關聯規則采用三元組的方式表示,在該三元組中記錄兩個詞條及該兩個詞條的關聯支持度。
進一步地,一種提高網頁訪問速度的裝置,包括:依次連接的數據保存模塊、數據挖掘模塊、網頁預測模塊和網頁下載模塊,其中:
數據保存模塊,用于保存歷史網頁數據;
數據挖掘模塊,用于從數據保存模塊讀取歷史網頁數據,得到頁面集合,從該頁面集合的頁面中抽取詞干,將詞干切分為詞條,得到與頁面對應的詞條集合,還生成頁面集合中頁面對應的詞條集合中詞條之間的興趣關聯規則,或頁面集合中頁面對應的詞條集合與鏈接詞條集合中詞條之間的興趣關聯規則,興趣關聯規則的組合構成興趣關聯規則數據庫;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010128121.6/2.html,轉載請聲明來源鉆瓜專利網。





