[發明專利]用戶相似度的估算方法及估算系統有效
| 申請號: | 201610041574.2 | 申請日: | 2016-01-21 |
| 公開(公告)號: | CN105718951B | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 楊春風 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 黃威 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 相似 估算 方法 系統 | ||
本發明提供一種用戶的相似度的估算方法及估算系統,包括:獲取用戶屬性,并根據用戶屬性將不同的用戶分成多個用戶組;讀取所述用戶組中每一用戶所對應的項目,以生成項目列表;將所述用戶組中的用戶與所述項目列表中的項目處理成二分圖;通過所述二分圖估算用戶的組內相似度;和/或通過所述二分圖估算用戶的組間相似度。本發明通過二分圖對用戶和項目進行分析,具有算法簡單、準確率高的優點,而且可以適應海量數據的環境,對系統資源占用少、且估算速度快。
技術領域
本發明屬于數據處理領域,尤其涉及一種用戶的相似度的估算方法及估算系統。
背景技術
隨著互聯網的普及,信息資源呈指數膨脹,從而帶來了信息過載的問題,使用戶時常迷失在大量的信息空間中,無法順利找到自己需要的信息。因此,便出現了各類的信息推薦技術,基于用戶的操作習慣對用戶與項目建立一定的關聯,比如觀看或點贊,進而生成信息推薦列表,比如,節目推薦列表、購物推薦列表、或朋友推薦列表等。
這些推薦技術的原理,主要是依據用戶的相似度,為目標用戶選取相似度高的已知用戶的項目列表,作為推薦信息。
傳統的用戶相似度的估算方法,主要是將用戶組的用戶兩兩估算相似度值,然后將這些相似度值進行平均,即為組間相似度。
但隨著用戶、及用戶操作行為的數據量越來越大,傳統估算方法的估算量也越來越大,對運算資源消耗較大,且費時費力,同時傳統算法中取平均值的誤差也會被海量數據所放大,影響了對用戶的相似度的評估的準確性,進而影響推薦信息的有效性,降低了用戶體驗。
發明內容
有鑒于此,本發明的目的在于提供一種用戶的相似度的估算方法及估算系統,可以解決現有技術中估算方法復雜、誤差大,進而影響估算速度和準確性的技術問題。
為解決上述技術問題,本發明實施例提供了如下技術方案:
一種用戶的相似度的估算方法,包括:
獲取用戶屬性,并根據用戶屬性將不同的用戶分成多個用戶組;
讀取所述用戶組中每一用戶所對應的項目,以生成項目列表;
將所述用戶組中的用戶與所述項目列表中的項目處理成二分圖;
通過所述二分圖估算用戶的組內相似度;和/或
通過所述二分圖估算用戶的組間相似度。
為解決上述技術問題,本發明實施例還提供了如下技術方案:
一種用戶的相似度的估算系統,包括:
分組模塊,用于獲取用戶屬性,并根據用戶屬性將不同的用戶分成多個用戶組;
列表模塊,用于讀取所述用戶組中每一用戶所對應的項目,以生成項目列表;
二分圖模塊,用于將所述用戶組中的用戶與所述項目列表中的項目處理成二分圖;以及
相似度模塊,用于通過所述二分圖估算用戶的組內相似度;和/或通過所述二分圖估算用戶的組間相似度。
相對于現有技術,本發明實施例提供的用戶的相似度的估算方法及估算系統,通過二分圖對用戶和項目進行分析,具有算法簡單、準確率高的優點,而且可以適應海量數據的環境,對系統資源占用少、且估算速度快。
附圖說明
圖1是本發明實施例一提供的用戶的相似度的估算方法的流程示意圖;
圖2是本發明實施例二提供的用戶的相似度的估算方法的流程示意圖;
圖3是本發明實施例三提供的信息推薦方法的流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610041574.2/2.html,轉載請聲明來源鉆瓜專利網。





