[發明專利]一種基于物品相似度的實時推薦方法有效
| 申請號: | 201611144613.8 | 申請日: | 2016-12-13 | 
| 公開(公告)號: | CN107066476B | 公開(公告)日: | 2021-07-30 | 
| 發明(設計)人: | 吳建黨;裴少芳;李業北;禹平;孟敬慈 | 申請(專利權)人: | 江蘇途致信息科技有限公司 | 
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06 | 
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 葉涓涓 | 
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 物品 相似 實時 推薦 方法 | ||
1.一種基于物品相似度的實時推薦方法,其特征在于,包括如下步驟:
步驟A,收集近期用戶行為數據,對行為數據進行預處理,當用戶在登陸狀態,使用userId的Murmur哈希值作為用戶標識;用戶在非登陸狀態下,使用visitor_trace的Murmur哈希值作為用戶標識,將用戶標識轉換成統一的長整型數據值;
步驟B,采用偏好函數模型計算每個用戶對瀏覽商品的偏好值,生成基礎用戶物品偏好值矩陣,計算得到物品相似矩陣,
所述偏好函數模型如下:
其中,k*e-x為時間權重計算公式,距離當前時間越近的用戶行為,越能反映用戶偏好;反之,距離當前時間越久遠的用戶行為,對用戶偏好定義越弱;i為初始值,xj表示當前時間與用戶訪問時間的時間差值;用戶每點擊一次商品,即在偏好值上累計加入該次瀏覽的偏好值;偏好值計算邏輯加入時間因素,同時兼顧點擊次數兩個權重因子,合理地把用戶對產品行為操作轉換成數值化的喜好值,最大程度上逼近用戶的真實喜好;
步驟C,篩選出當前訪客的最新行為數據,處理成實時偏好矩陣,結合物品相似矩陣,計算用戶推薦列表,包括:
步驟C-1,篩選最新的訪客用戶的所有行為數據,對數據進行預處理,當用戶在登陸狀態,使用userId的Murmur哈希值作為用戶標識;用戶在非登陸狀態下,使用visitor_trace的Murmur哈希值作為用戶標識,將用戶標識統一轉換成長整型數值;
步驟C-2,采用偏好函數模型轉換每個用戶對瀏覽商品的偏好值,將所有用戶對某個物品的偏好值作為一個向量來計算物品之間的相似度,生成實時用戶物品偏好矩陣;
步驟C-3,利用步驟B得到的當天已保存的物品相似矩陣,采用矩陣乘法,通過下式計算:
物品相似矩陣*實時用戶物品偏好矩陣
步驟C-4,基于步驟C-3得到的結果,計算各用戶對同一物品下的中間值之和,得到各用戶對各產品的預測值,過濾掉用戶已瀏覽和已下單商品后,按偏好值大小排序,取排在前面的若干商品為推薦列表。
2.根據權利要求1所述的基于物品相似度的實時推薦方法,其特征在于,為了避免推薦熱門產品,步驟C-4中,加入相似度作為懲罰因子,預測值通過下式計算得到:
預測值=Σ中間值/Σ相似度。
3.根據權利要求1所述的基于物品相似度的實時推薦方法,其特征在于:所述步驟C基于MapReduce開發。
5.根據權利要求1所述的基于物品相似度的實時推薦方法,其特征在于:所述步驟C基于SparkStreaming開發。
6.根據權利要求5所述的基于物品相似度的實時推薦方法,其特征在于:時間窗口設置為5s,每隔5s檢測數據流更新情況,一旦更新,則收集更新的數據運算后進行推薦。
7.根據權利要求1所述的基于物品相似度的實時推薦方法,其特征在于:所述物品相似矩陣通過調用mahout-itembased接口得到。
8.根據權利要求1所述的基于物品相似度的實時推薦方法,其特征在于:所述物品相似矩陣采用稀疏矩陣來保存。
9.根據權利要求1所述的基于物品相似度的實時推薦方法,其特征在于:當用戶在用戶物品偏好值矩陣中只對一個物品打分時,則不計算該用戶的推薦列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇途致信息科技有限公司,未經江蘇途致信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611144613.8/1.html,轉載請聲明來源鉆瓜專利網。





