[發明專利]一種計算用戶之間相似度的方法及裝置有效
| 申請號: | 201710909747.2 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN110020118B | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 陳磊 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 用戶 之間 相似 方法 裝置 | ||
1.一種計算用戶之間相似度的方法,其特征在于,所述方法包括:
獲取M個用戶各自對應的歷史關注信息以及所述歷史關注信息對應的上下文信息,其中,M為大于或者等于2的整數;
根據所述歷史關注信息以及所述歷史關注信息對應的上下文信息計算用戶之間的相似度;
所述根據所述歷史關注信息以及所述歷史關注信息對應的上下文信息計算用戶之間的相似度,包括:
基于所述歷史關注信息,確定第i個用戶與第j個用戶所共同關注的N個業務對象,其中,N為大于或者等于1的整數,i小于或者等于M,j小于或者等于M,i不等于j;
針對所述N個業務對象,根據所述歷史關注信息以及所述歷史關注信息對應的上下文信息,獲取所述第i個用戶對應的第一關注度集和所述第一關注度集對應的第一上下文信息集,并獲取所述第j個用戶對應的第二關注度集和所述第二關注度集對應的第二上下文信息集;
基于所述第一上下文信息集和所述第二上下文信息集,計算所述N個業務對象對應的上下文相關系數集,具體為:基于所述第一上下文信息集和所述第二上下文信息集,通過皮爾森相關系數計算公式,計算所述N個業務對象各自對應的皮爾森相關系數;基于所述N個業務對象各自對應的皮爾森相關系數,計算每一個業務對象的上下文相關系數;
基于所述上下文相關系數集、所述第一關注度集和所述第二關注度集,計算所述第i個用戶與所述第j個用戶之間的相似度;
所述基于所述上下文相關系數集、所述第一關注度集和所述第二關注度集,計算所述第i個用戶與所述第j個用戶之間的相似度,包括:
計算所述第一關注度集中N個第一關注度值的平均值,獲得第一均值,其中,所述N個第一關注度值與所述N個業務對象一一對應;
計算所述第二關注度集中N個第二關注度值的平均值,獲得第二均值,其中,所述N個第二關注度值與所述N個業務對象一一對應;
基于所述上下文相關系數集中的N個上下文相關系數、所述N個第一關注度值、所述N個第二關注度值、所述第一均值以及所述第二均值,通過相似度計算公式,計算所述第i個用戶與所述第j個用戶之間的相似度;
其中,所述相似度計算公式為:
在所述相似度計算公式中,Sim(i,j)表示第i個用戶與第j個用戶之間的相似度,wv表示物品v的權重,即物品v對應的上下文相關系數,Riv表示所述第v個業務對象對應的第一關注度值,表示第一均值,Rjv表示第v個業務對象對應的第二關注度值,表示第二均值,Vij表示第i個用戶與第j個用戶所共同關注的N個業務對象。
2.根據權利要求1所述的方法,其特征在于,其中,所述皮爾森相關系數計算公式為:
在所述皮爾森相關系數計算公式中,pccv表示所述N個業務對象中的第v個業務對象的皮爾森相關系數,Xv表示所述第一上下文信息集中與所述第v個業務對象對應的第v個第一上下文信息子集,Xgv表示第v個第一上下文信息子集中的第g種第一上下文信息,表示第i個用戶關注第v個業務對象時的各種第一上下文信息的均值,Yv表示所述第二上下文信息集中與所述第v個業務對象對應的第v個第二上下文信息子集,Ygv表示第v個第二上下文信息子集中的第g種第二上下文信息,表示第j個用戶關注第v個業務對象時的各種第二上下文信息的均值,g為大于或者等于1的整數,v小于或者等于N。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710909747.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種興趣信息獲取方法、裝置及電子設備
- 下一篇:信息顯示方法、系統及終端





