[發明專利]一種優化用戶相似度的協同過濾方法在審
| 申請號: | 201910312071.8 | 申請日: | 2019-04-18 |
| 公開(公告)號: | CN110134874A | 公開(公告)日: | 2019-08-16 |
| 發明(設計)人: | 安彥涵;張新鵬;吳漢舟;余江;王子馳 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06K9/62 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 協同過濾 相似度 用戶相似度 算法 優化 預處理 用戶評分數據 向量距離 傳統的 非對稱 權重和 數據集 權重 延時 服務器 標準化 | ||
本發明提出了一種優化用戶相似度的協同過濾方法。在不增加服務器延時的同時,提高推薦算法的精度。該方法的特點在于:通過對用戶評分數據進行標準化預處理,計算Pearson相似度、用戶向量距離的評價權重和非對稱的相似度權重,進而對Pearson相似度進行優化,從而使得傳統的協同過濾算法推薦精度得到提高。本方法適用于用戶——項目評分的數據集。
技術領域
針對基于協同過濾的推薦系統,本發明提出了一種優化用戶相似度的協同過濾方法。
背景技術
互聯網的快速發展和普及為用戶獲取、分享和傳播信息提供了極大的便利。與此同時,信息量的大幅增長卻降低了信息的利用率,使用戶很難及時從網絡中獲得對自己真正有用的信息,造成信息超載問題。一種能有效應對信息超載問題的方法是設計推薦系統,它根據用戶的需求、興趣等信息,將用戶感興趣的內容和產品推薦給用戶。和搜索引擎相比,推薦系統通過研究用戶的興趣、偏好,進行個性化計算,從而發現用戶的興趣點,進而引導用戶發現自己的信息需求,并獲取對自己有用的信息。好的推薦系統不僅能為用戶提供個性化的服務,還能為不同用戶建立相互之間的密切關系,讓用戶對推薦產生依賴。
推薦系統主要包括內容過濾和協同過濾。基于內容過濾的推薦系統根據用戶以前的瀏覽或購買記錄得到用戶關注項目的特征,將最符合用戶興趣特征的新項目推薦給用戶。而基于協同過濾的推薦系統是通過計算用戶之間歷史記錄的相似性得到用戶間的相似程度,搜尋與目標用戶偏好相似的其他用戶,將這類用戶感興趣的項目推薦給目標用戶。
基于內容過濾的推薦系統只考慮目標用戶本身,基于協同過濾的推薦系統則充分利用了集體智慧,即在大量的人群的行為和數據中收集答案,推薦的個性化程度更高,所以協同過濾推薦算法是個性化推薦服務中應用最為廣泛、有效的推薦算法。
基于協同過濾的推薦系統又分為基于模型的協同過濾推薦系統和基于記憶的協同過濾推薦系統。前者主要是利用機器學習、數據挖掘和統計學等方法,對用戶的歷史數據進行訓練,然后構造相對應的用戶模型,利用該模型為用戶提供預測和推薦,涉及矩陣分解,隱語義分析等技術。后者分為基于用戶的協同過濾推薦系統和基于項目的協同過濾推薦系統。
傳統的基于用戶的協同過濾推薦系統雖采用Pearson公式度量相似度,但未對數據集進行預處理、不考慮用戶評分向量間的距離、未考慮用戶間的相似性關系的不平等性,會使推薦系統的推薦質量下降。為此,本發明針對基于用戶的協同過濾推薦算法,對上述三點進行優化,提高推薦質量。
發明內容
本發明致力于降低傳統的基于用戶的協同過濾推薦算法的平均絕對誤差值,有效提高推薦系統的推薦質量,提供一種優化用戶相似度的協同過濾方法。
為達到上述目的,本發明提出如下技術方案:
一種優化用戶相似度的協同過濾方法,通過將用戶的評分向量標準化,結合用戶向量距離的評價權重、非對稱的相似度權重對Pearson相似度優化,最后進行用戶評分的預測,具體步驟如下:
1)籌備實驗數據庫:收集一定數量用戶對不同項目的評分值,建立實驗數據庫;
2)標準化預處理:運用Z-score方法對每個用戶的評分向量進行標準化,并依據標準化后的用戶評分向量,生成用戶——項目評分矩陣;
3)計算用戶的相似度矩陣:根據步驟2)生成的用戶——項目評分矩陣,計算Pearson相似度、用戶向量距離的評價權重、非對稱的相似度權重;結合用戶向量距離的評價權重、非對稱的相似度權重對Pearson相似度進行優化,得出優化后的相似度公式,根據優化后的相似度公式計算出每個用戶與其他用戶的相似度,最終生成相似度矩陣;
4)預測評分:依據目標用戶與其他用戶的相似度,計算目標用戶的鄰居用戶集合,通過評分公式對目標用戶的未評分項目進行預測。
與現有技術相比,本發明具有如下的優點:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910312071.8/2.html,轉載請聲明來源鉆瓜專利網。





