[發明專利]網站的分類方法及裝置在審
| 申請號: | 201611152977.0 | 申請日: | 2016-12-14 |
| 公開(公告)號: | CN108228602A | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 孫召偉 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網站 分類 用戶訪問數據 相似度 預設時間間隔 互聯網技術 相似度算法 標簽方式 訪問網站 聚類算法 時間屬性 預設 預置 統計 | ||
本發明公開了一種網站的分類方法及裝置,涉及互聯網技術領域,主要目的在于解決人工打標簽方式操作成本大,且無法根據用戶的具體需求對訪問網站進行分類的問題。本發明的主要技術方案為:獲取不同網站符合預設時間間隔條件的用戶訪問數據;按照時間屬性統計所述用戶訪問數據的平均值;根據所述平均值及預設相似度算法計算所述不同網站之間的相似度;通過所述相似度及預置聚類算法對所述不同網站進行分類。主要用于網站的分類。
技術領域
本發明涉及互聯網技術領域,尤其涉及一種網站的分類方法及裝置。
背景技術
隨著互聯網技術的不斷發展,越來越多的用戶通過訪問網站來獲取信息。其中,不同人群會根據不同的需求會訪問不同類型的網站,對網站的分類成為分析用戶訪問網站情況的必要手段。
目前,現有的網站分類方法是通過人工對不同屬性的網站進行人工打標簽,如,音樂類、電商類、新聞類、門戶類等等,再根據標注的標簽進行分類,但是人工打標簽方式是按照網站的屬性類型進行分類,操作成本大,且無法根據用戶的具體需求對訪問網站進行分類,導致網站分類的效率較低。
發明內容
鑒于上述問題,提出了本發明以便提供一種網站的分類方法及裝置,主要目的是解決人工打標簽方式操作成本大,且無法根據用戶的具體需求對訪問網站進行分類的問題。
借由上述技術方案,本發明提供的一種網站的分類方法,包括:
獲取不同網站符合預設時間間隔條件的用戶訪問數據,所述用戶訪問數據為用戶瀏覽網站所產生的流量數據;
按照時間屬性統計所述用戶訪問數據的平均值;
根據所述平均值及預設相似度算法計算所述不同網站之間的相似度;
通過所述相似度及預置聚類算法對所述不同網站進行分類。
借由上述技術方案,本發明提供的一種網站的分類裝置,包括:
獲取單元,用于獲取不同網站符合預設時間間隔條件的用戶訪問數據,所述用戶訪問數據為用戶瀏覽網站所產生的流量數據;
統計單元,用于按照時間屬性統計所述用戶訪問數據的平均值;
計算單元,用于根據所述平均值及預設相似度算法計算所述不同網站之間的相似度;
分類單元,用于通過所述相似度及預置聚類算法對所述不同網站進行分類。
借由上述技術方案,本發明實施例提供的技術方案至少具有下列優點:
本發明實施例提供的一種網站的分類方法及裝置,首先獲取不同網站符合預設時間間隔條件的用戶訪問數據,所述用戶訪問數據為用戶瀏覽網站所產生的流量數據,然后按照時間屬性統計所述用戶訪問數據的平均值,再根據所述平均值及預設相似度算法計算所述不同網站之間的相似度,最后通過所述相似度及預置聚類算法對所述不同網站進行分類。與現有的人工打標簽方式且無法根據用戶的具體需求對訪問網站進行分類相比,本發明實施例將不同時間點的網站中用戶訪問數據按照時間屬性計算平均值,然后將平均值作為預設相似度算法的參數計算網站之間的相似度,再根據相似度及預置的聚類算法對網站進行分類,避免手動打標簽進行分類,實現根據時間序列對用戶在不同時間點訪問的網站進行分類,進一步實現根據用戶的需求對用戶訪問的網站進行分類,增加了網站分類的多樣性,從而提高網站分類的效率。
上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611152977.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種主數據讀寫系統及主數據讀寫方法
- 下一篇:一種網站跳出率計算方法及服務器





