[發明專利]瀏覽器收藏夾整理方法和裝置有效
| 申請號: | 201410232621.2 | 申請日: | 2014-05-28 |
| 公開(公告)號: | CN105224533B | 公開(公告)日: | 2019-09-03 |
| 發明(設計)人: | 肖鏡輝;崔華 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958 |
| 代理公司: | 北京華沛德權律師事務所 11302 | 代理人: | 馬苗苗 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 瀏覽器 收藏夾 整理 方法 裝置 | ||
1.一種瀏覽器收藏夾整理方法,其特征在于,包括:
獲取待整理瀏覽器收藏夾的目錄結構信息以及各鏈接地址;
在根據所述目錄結構信息確定出所述待整理瀏覽器收藏夾中包含有非根目錄的情況下,根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址及其目錄標識確定待整理瀏覽器收藏夾的根目錄下的各鏈接地址與待整理瀏覽器收藏夾的非根目錄下的各鏈接地址之間的相似度,并將待整理瀏覽器收藏夾的根目錄下的與非根目錄下的鏈接地址相似的鏈接地址調整到相應的非根目錄下;
在待整理瀏覽器收藏夾的當前根目錄下包含有多個鏈接地址的情況下,根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址及其目錄標識確定待整理瀏覽器收藏夾的當前根目錄下的各鏈接地址之間的相似度,并根據所述各鏈接地址之間的相似度對當前根目錄下的各鏈接地址進行聚類;
根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址及其目錄標識為上述聚類獲得的每一類鏈接地址設置非根目錄標識,并將所述每一類鏈接地址調整到所述非根目錄標識所表示的非根目錄下。
2.如權利要求1所述的方法,其特征在于,所述根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址及其目錄標識確定待整理瀏覽器收藏夾的根目錄下的各鏈接地址與待整理瀏覽器收藏夾的非根目錄下的各鏈接地址之間的相似度,并將待整理瀏覽器收藏夾的根目錄下的與非根目錄下的鏈接地址相似的鏈接地址調整到相應的非根目錄下包括:
計算待整理瀏覽器收藏夾的根目錄下的各鏈接地址與待整理瀏覽器收藏夾的非根目錄下的各鏈接地址的特征向量之間的余弦距離;
分別判斷各余弦距離是否達到第一距離閾值,并將余弦距離達到第一距離閾值的根目錄下的鏈接地址調整到相應的非根目錄下;
其中,所述鏈接地址的特征向量為:根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址及其目錄標識統計出的鏈接地址屬于非根目錄標識的分布情況。
3.如權利要求1所述的方法,其特征在于,所述根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址及其目錄標識確定待整理瀏覽器收藏夾的當前根目錄下的各鏈接地址之間的相似度,并根據所述各鏈接地址之間的相似度對當前根目錄下的各鏈接地址進行聚類包括:
計算待整理瀏覽器收藏夾的當前根目錄下的各鏈接地址的特征向量之間的余弦距離;
針對待整理瀏覽器收藏夾的當前根目錄下的一個鏈接地址而言,將該鏈接地址和與其特征向量之間的余弦距離達到第二距離閾值的所有鏈接地址劃分為一類;
其中,所述鏈接地址的特征向量為:根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址及其目錄標識統計出的鏈接地址屬于非根目錄標識的分布情況。
4.如權利要求2或3所述的方法,其特征在于,所述多個用戶包括:專家用戶和非專家用戶;
且所述鏈接地址的特征向量為:在專家用戶的瀏覽器收藏夾的非根目錄所具有的權重高于非專家用戶的瀏覽器收藏夾的非根目錄所具有的權重的情況下,統計出的鏈接地址屬于非根目錄標識的分布情況;
其中,所述專家用戶是指對其瀏覽器收藏夾中的鏈接地址的維護使用符合預定要求的用戶。
5.如權利要求1或2或3所述的方法,其特征在于,所述多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址包括:對采集的多個用戶的瀏覽器收藏夾的各鏈接地址進行噪音數據濾除后獲得的鏈接地址。
6.如權利要求5所述的方法,其特征在于,所述噪音數據包括:預定長時間內未被用戶使用的鏈接地址以及失效的鏈接地址。
7.如權利要求1或2或3所述的方法,其特征在于,所述根據多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址為上述聚類獲得的每一類鏈接地址設置非根目錄標識包括:
針對聚類后的一類鏈接地址而言,根據所述多個用戶的瀏覽器收藏夾的非根目錄下的鏈接地址確定該類中的各鏈接地址所屬的非根目錄標識的分布情況,并根據所述分布情況為該類鏈接地址設置非根目錄標識。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410232621.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用戶標識的處理方法及裝置
- 下一篇:一種按地區個性化網站的方法





