[發明專利]一種網頁預取方法和系統無效
| 申請號: | 201110165459.3 | 申請日: | 2011-06-20 |
| 公開(公告)號: | CN102222098A | 公開(公告)日: | 2011-10-19 |
| 發明(設計)人: | 彭海朋;萬淼;沈紅斌;李麗香;王樅;楊義先 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網頁 方法 系統 | ||
技術領域
本發明涉及網頁預取技術,尤其涉及一種基于混沌蟻群優化聚類的網頁預取方法及系統。
背景技術
隨著Internet的迅速發展和廣泛普及,信息快速增長與人們注意力有限性的矛盾在不斷增加,網絡用戶日益關注如何能夠在最短的時間內找到最適合自己的信息。各網站的運營商也越來越希望了解訪問者在網站的活動情況,從龐大的用戶群的數據海洋中挖掘客戶活動信息,讓用戶可以得到個性化的服務。
要提高網站的影響力,為用戶提供更好的服務,就應該根據用戶的瀏覽模式來改進網站結構以提高Web服務質量,并最終實現網站的個性化推薦。
發明內容
本發明所要解決的技術問題是在于需要提供一種網頁預取技術,達到提高網站服務質量的目的。
為了解決上述技術問題,本發明首先提供了一種網頁預取方法,包括如下步驟:
對網絡日志進行預處理,獲得可信網絡日志;
根據用戶的訪問興趣以及該可信網絡日志,建立表達用戶是否訪問了特征網頁的用戶訪問模式矩陣;
使用基于混沌蟻群優化的聚類算法對該用戶訪問模式矩陣進行優化聚類,并根據預設的類別標簽標記用戶所屬的類別,建立用戶公共檔案;
根據該用戶公共檔案,將預取概率超過預設的預取概率閾值的頁面提取并保存到緩存中。
其中,對該網絡日志進行預處理的步驟,包括:
對該網絡日志進行數據清洗、用戶識別以及會話識別。
其中,對該網絡日志進行該數據清洗的步驟,包括:
過濾網頁中的圖片,過濾動態網頁以及點擊率低于預設點擊閾值的網頁。
其中,使用該基于混沌蟻群優化的聚類算法對該用戶訪問模式矩陣進行該優化聚類,根據該類別標簽標記用戶所屬的類別,建立該用戶公共檔案的步驟,包括:
使用該基于混沌蟻群優化的聚類算法對該用戶訪問模式矩陣進行優化聚類,得到聚類中心的位置;
根據用戶與各聚類中心的距離,采用該類別標簽標記用戶所屬的類別,根據用戶所屬的類別建立該用戶公共檔案。
本發明還提供了一種基于混沌蟻群優化聚類的網頁預取系統,包括:
預處理模塊,用于對網絡日志進行預處理,獲得可信網絡日志;
第一建立模塊,用于根據用戶的訪問興趣以及該可信網絡日志,建立表達用戶是否訪問了特征網頁的用戶訪問模式矩陣;
第二建立模塊,用于使用基于混沌蟻群優化的聚類算法對該用戶訪問模式矩陣進行優化聚類,并根據預設的類別標簽標記用戶所屬的類別,建立用戶公共檔案;
預提取模塊,用于根據該用戶公共檔案,將預取概率超過預設的預取概率閾值的頁面提取并保存到緩存中。
其中,該預處理模塊用于對該網絡日志進行數據清洗、用戶識別以及會話識別,獲得該可信網絡日志。
其中,該預處理模塊用于過濾網頁中的圖片,過濾動態網頁以及點擊率低于預設點擊閾值的網頁。
其中,該第二建立模塊包括:
聚類單元,用于使用該基于混沌蟻群優化的聚類算法對該用戶訪問模式矩陣進行優化聚類,得到聚類中心的位置;
建立單元,用于根據用戶與各聚類中心的距離,采用該類別標簽標記用戶所屬的類別,根據用戶所屬的類別建立該用戶公共檔案。
與現有技術相比,本發明具有以下優點:
針對網絡日志海量、高維、數據規模多樣的特點,本發明提出的基于混沌蟻群優化聚類的網頁預取技術,具有收斂效果好、適用于包含的類具有多個大小和密度的數據集、適用于高維數據的優點。本發明提出的群組網頁預取方案,與現有預取技術相比,準確率有了大幅度的提高。
本發明的技術方案可以用于眾多通用或專用的計算系統環境或配置中。例如:個人計算機、服務器計算機、多處理器系統、網絡PC、大型計算機、包括以上任何系統或設備的分布式計算環境等等。
附圖說明
圖1是本發明實施例基于混沌蟻群優化聚類的網頁預取方法的流程示意圖;
圖2是本發明實施例基于混沌蟻群優化聚類的網頁預取系統的組成示意圖。
具體實施方式
以下將結合附圖及實施例來詳細說明本發明的實施方式。
本發明設計了一種基于混沌蟻群優化的網頁預取方法和系統,以達到降低響應時間,提高網站服務質量的目的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110165459.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種冷沖壓模具
- 下一篇:一種可切換頻率的無線鼠標





