[發明專利]一種基于網頁瀏覽的用戶興趣建模方法有效
| 申請號: | 201110447908.3 | 申請日: | 2011-12-27 |
| 公開(公告)號: | CN102402766B | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 韓軍 | 申請(專利權)人: | 北京京東尚科信息技術有限公司 |
| 主分類號: | G06F17/00 | 分類號: | G06F17/00 |
| 代理公司: | 上海弼興律師事務所31283 | 代理人: | 薛琦 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網頁 瀏覽 用戶 興趣 建模 方法 | ||
1.一種基于網頁瀏覽的用戶興趣建模方法,其特征在于,包括如下步驟:
1)根據電子商務網站的商品分類目錄結構,將目錄層次的最后一級目錄作為用戶的興趣點,一個興趣點包含該目錄下的所有商品頁面;
2)用戶的興趣模型包括三個維度:空間興趣維度P、時間興趣維度T、興趣轉移維度C,通過用戶在網站的瀏覽記錄,計算上述三個維度;
3)空間興趣維度P用于描述用戶興趣的傾向性,其表示為:
P={(W0,IP0),(W1,IP1),...,(Wn,IPn)}
其中,Wi代表用戶訪問興趣點i的總次數,IPi描述的是用戶對興趣點i中每個商品的興趣矢量,其表達式為:
IPi=[w0,w1,...,wm]
其中,wj代表用戶對興趣點中商品j的興趣度;
4)時間興趣維度T用于描述用戶的長期興趣和短期興趣,其表示為:
T={(LT0,ST0),(LT1,ST1),...,(LTn,STn)}
其中,LTi代表用戶對興趣點i訪問的總在線時間,STi代表用戶最近訪問興趣點的密度;
5)興趣轉移維度C用于描述用戶在不同興趣點之間的相關性,其表達式為:
Ix,Iy代表兩個不同的興趣點x和y,P(Ix,Iy)代表用戶的會話同時包含興趣點x和y的概率,P(Ix)代表用戶的會話包含興趣點x的概率,P(Iy)代表用戶的會話包含興趣點y的概率,C(Ix,Iy)反映了興趣點x和y的相關性,值大于1表示正相關,值小于1表示負相關,值等于1表示不相關;
其中,n+1代表興趣點的總個數,m+1代表每個興趣點中的商品的總個數,i為整數,且0≤i≤n,j為整數,且0≤j≤m。
2.根據權利要求1所述的方法,其特征在于,用戶對興趣點中商品的興趣度wj的計算方法如下:
其中,CNT(j)代表用戶對興趣點中商品j的訪問次數,PU代表該商品所屬興趣點所擁有的用戶總數,IPUj代表該商品所擁有的用戶總數。
3.根據權利要求1所述的方法,其特征在于,用戶對興趣點i訪問的總在線時間的計算公式為:
其中,a代表用戶訪問的次數,tk代表第k次訪問所花費的時間。
4.根據權利要求1或3所述的方法,其特征在于,用戶對興趣點i的最近訪問興趣密度的計算公式為:
其中,θ代表一個固定的時間間隔,tkθ代表從當前時間開始往前kθ的時間范圍內,用戶訪問興趣點i的總時間,b是一個參數,用于設定訪問興趣密度計算的時間跨度范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司,未經北京京東尚科信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110447908.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光碟機與計算機系統及其控制方法
- 下一篇:決明子枕芯





