[發明專利]一種基于物品相似度的實時推薦方法有效
| 申請號: | 201611144613.8 | 申請日: | 2016-12-13 |
| 公開(公告)號: | CN107066476B | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 吳建黨;裴少芳;李業北;禹平;孟敬慈 | 申請(專利權)人: | 江蘇途致信息科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 葉涓涓 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 物品 相似 實時 推薦 方法 | ||
本發明公開了一種基于物品相似度的實時推薦方法,包括預處理歷史用戶數據的步驟,計算T+1相似矩陣的步驟,收集最新用戶數據的步驟,計算用戶偏好矩陣的步驟,根據相似矩陣和偏好矩陣計算推薦列表的步驟。本發明能夠將登陸和未登錄用戶的用戶標識進行統一,并提出了合理的偏好值計算邏輯,加入時間因素,同時兼顧點擊次數兩個權重因子,合理地把用戶對產品行為操作轉換成數值化的喜好值,最大程度上逼近用戶的真實喜好,使得用戶偏好值的計算更為精確,更為重要的是根據實時獲取的用戶行為數據進行計算,從而大大提升了推薦效率和計算精確度。
技術領域
本發明屬于數據處理技術領域,具體涉及一種基于item-based的實時推薦方法。
背景技術
近年來,隨著互聯網的飛速發展,網絡已經逐漸成為人們選購商品、查詢商品信息數據的第一選擇。商品種類繁多,信息細化,網站在為用戶提供越來越多選擇的同時其結構也變得更加復雜,面對不計其數的商品信息,用戶經常會迷失在大量的商品信息空間中,無法順利找到自己需要的商品。
為解決這一問題,個性化推薦方法應運而生。傳統推薦方法基于物品的協同過濾技術,即是預先根據所有用戶的歷史偏好數據計算物品之間的相似性,然后把與用戶歷史訪問的物品相類似的topN物品推薦給用戶。其具體思想是:先預處理用戶訪問記錄,根據用戶物品偏好值計算物品相似矩陣,向用戶推薦其偏好物品的相似物品。
但采用傳統推薦方法的效果并不理想,不僅推薦準確度不高,而且運算效率低下。究其原因,是因為傳統方法有如下幾個缺陷:首先由于用戶偏好值設置較為簡單,導致傳統的用戶偏好矩陣不能很好地表示用戶喜好,這就導致了后續計算的偏差會被持續放大。其次運算時每次都需要計算全量用戶,這就重復計算了訪問行為實際沒有變化的用戶推薦列表,導致消耗計算資源較多。此外,目前基于協同過濾技術基本應用于T+1推薦,沒有拓展到實時推薦,使得推薦列表更新速度太慢,難以滿足實際需求。
發明內容
為解決上述問題,本發明公開了一種基于物品相似度的實時推薦方法,能夠將登陸和未登錄用戶的用戶標識進行統一,并定義了更為精確的用戶偏好值函數, 更為重要的是根據實時獲取的用戶行為數據進行計算,從而大大提升了推薦效率和計算精確度。
為了達到上述目的,本發明提供如下技術方案:
一種基于物品相似度的實時推薦方法,包括如下步驟:
步驟A,收集近期用戶行為數據,對行為數據進行預處理,當用戶在登陸狀態,使用userId的Murmur哈希值作為用戶標識;用戶在非登陸狀態下,使用visitor_trace的Murmur哈希值作為用戶標識,將用戶標識轉換成統一的長整型數據值;
步驟B,采用偏好函數模型計算每個用戶對瀏覽商品的偏好值,生成基礎用戶物品偏好值矩陣,計算物品相似矩陣,
所述偏好函數模型如下:
score =
其中
步驟C,篩選出當前訪客的最新行為數據,處理成實時偏好矩陣,結合物品相似矩陣,計算用戶推薦列表,包括:
步驟C-1,篩選最新的訪客用戶的所有行為數據,對數據進行預處理,當用戶在登陸狀態,使用userId的Murmur哈希值作為用戶標識;用戶在非登陸狀態下,使用visitor_trace的Murmur哈希值作為用戶標識,將用戶標識統一轉換成長整型數值;
步驟C-2,采用偏好函數模型轉換每個用戶對瀏覽商品的偏好值,將所有用戶對某個物品的偏好值作為一個向量來計算物品之間的相似度,生成實時用戶物品偏好矩陣;
步驟C-3,利用步驟B得到的當天已保存的物品相似矩陣,采用矩陣乘法,通過下式計算:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇途致信息科技有限公司,未經江蘇途致信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611144613.8/2.html,轉載請聲明來源鉆瓜專利網。





