[發明專利]一種網頁推薦方法和裝置有效
| 申請號: | 201210080831.5 | 申請日: | 2012-03-23 |
| 公開(公告)號: | CN103324645B | 公開(公告)日: | 2018-10-09 |
| 發明(設計)人: | 王犇;何軍;楊志峰 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網頁 推薦 方法 裝置 | ||
1.一種網頁推薦的方法,其特征在于,該方法包括:
獲取點擊查詢日志,所述點擊查詢日志包括用戶ID、關鍵詞、以及網頁ID;
匯總每個用戶ID的關鍵詞,建立該用戶ID的興趣模型;匯總所有用戶ID的網頁ID,獲取每個網頁ID對應的網頁中的關鍵詞,建立該網頁ID的興趣模型;根據用戶ID的興趣模型和網頁ID的興趣模型確定用戶ID和網頁ID的關聯度;其中,所述匯總所有用戶ID的網頁ID,獲取每個網頁ID對應的網頁中的關鍵詞,建立該網頁ID的興趣模型包括:對該網頁ID對應的網頁的內容進行分詞,去除無效詞,統計剩余的每個關鍵詞在該網頁中的出現次數,根據該關鍵詞的出現次數確定該網頁ID對該關鍵詞的興趣度;所述匯總每個用戶ID的關鍵詞,建立該用戶ID的興趣模型包括:匯總該用戶ID對應的用戶查詢過的所有關鍵詞,統計該用戶查詢每個關鍵詞時點擊網頁ID的個數,根據點擊網頁ID的個數確定該用戶ID對該關鍵詞的興趣度;
當接收到用戶的點擊搜索結果命令進入無線網頁搜索轉碼頁時,按照和用戶ID的關聯度從高到低的順序選擇第一預設個數的網頁ID,將選擇的每個網頁ID對應的網頁在該轉碼頁中進行推薦。
2.根據權利要求1所述的網頁推薦方法,其特征在于,
所述用戶ID的興趣模型包括第一興趣項,所述第一興趣項包括多個第一興趣子項,所述第一興趣子項包括關鍵詞、用戶ID對關鍵詞的興趣度;
所述網頁ID的興趣模型包括第二興趣項,所述第二興趣項包括多個第二興趣子項,所述第二興趣子項包括關鍵詞、網頁ID對關鍵詞的興趣度。
3.根據權利要求2所述的網頁推薦方法,其特征在于,
所述根據用戶ID的興趣模型和網頁ID的興趣模型確定用戶ID和網頁ID的關聯度包括:
根據每個用戶ID的興趣模型中用戶ID對各個關鍵詞的興趣度生成N維向量VK1;
根據每個網頁ID的興趣模型中網頁ID對各個關鍵詞的興趣度生成N維向量VK2;
計算N維向量VK1和VK2間的距離DK,將DK記為該用戶ID和該網頁ID間的關聯度。
4.根據權利要求2所述的網頁推薦方法,其特征在于,
所述用戶ID的興趣模型包括第三興趣項,所述第三興趣項包括多個第三興趣子項,所述第一興趣子項包括關鍵詞類型、用戶ID對關鍵詞類型的興趣度;
所述匯總每個用戶ID的關鍵詞,建立該用戶ID的興趣模型包括:匯總該用戶ID對應的用戶查詢過的所有關鍵詞并確定每個關鍵詞所屬類型;統計該用戶查詢每類關鍵詞時點擊網頁ID的個數,根據點擊網頁ID的個數確定該用戶ID對該類關鍵詞的興趣度;
所述網頁ID的興趣模型包括第四興趣項,所述第四興趣項包括多個第四興趣子項,所述第四興趣子項包括關鍵詞類型、網頁ID對關鍵詞類型的興趣度;
所述匯總所有用戶ID的網頁ID,獲取每個網頁ID對應的網頁中的關鍵詞,建立該網頁ID的興趣模型包括:對該網頁ID對應的網頁的內容進行分詞,去除無效詞,確定剩余每個關鍵詞所屬類型,統計每類關鍵詞在該網頁中的出現次數,根據該類關鍵詞的出現次數確定該網頁ID對該類關鍵詞的興趣度。
5.根據權利要求4所述的網頁推薦方法,其特征在于,
所述根據用戶ID的興趣模型和網頁ID的興趣模型確定用戶ID和網頁ID的關聯度包括:
根據每個用戶ID的興趣模型中用戶ID對各類關鍵詞的興趣度生成N維向量VC1;
根據每個網頁ID的興趣模型中網頁ID對各類關鍵詞的興趣度生成N維向量VC2;
計算N維向量VC1和VC2間的距離DC,將DC記為該用戶ID和該網頁ID間的關聯度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210080831.5/1.html,轉載請聲明來源鉆瓜專利網。





