[發明專利]信息推薦方法和裝置有效
| 申請號: | 201610305668.6 | 申請日: | 2016-05-10 |
| 公開(公告)號: | CN107357793B | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 鄭子彬 | 申請(專利權)人: | 騰訊科技(深圳)有限公司;中山大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/955 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 推薦 方法 裝置 | ||
1.一種信息推薦方法,所述方法包括:
根據跨領域的用戶數據提取用戶標簽;所述跨領域的用戶數據是在用戶的不同活動場景下的行為所產生的數據;
將相同用戶的所述用戶標簽形成用于描述所述用戶的用戶標簽集;
根據主題生成模型和所述用戶標簽集確定所述用戶標簽集所屬主題,并將所述用戶標簽集所屬主題作為用戶所屬用戶社區;
將用戶屬性信息、所述跨領域的用戶數據以及所述用戶所屬用戶社區進行二值化處理,獲得相應的特征向量;計算各種特征向量彼此之間的關聯性;通過機器學習分別訓練所述用戶屬性信息、所述跨領域的用戶數據以及所述用戶所屬用戶社區各自對應的權重;根據各種特征向量、各種特征向量分別對應的所述權重及各種特征向量彼此之間的關聯性預測用戶評分值;根據所述用戶評分值進行信息推薦。
2.根據權利要求1所述的方法,其特征在于,所述根據跨領域的用戶數據提取用戶標簽,包括:
獲取跨領域的每份用戶數據的詞在相應用戶數據中的詞頻;
獲取跨領域的各份用戶數據中包括所述詞的用戶數據份數;
獲取所述詞的重要度評分;所述重要度評分與所述詞頻正相關,且與所述用戶數據份數負相關;
根據所述重要度評分篩選出關鍵詞;
根據所述關鍵詞確定用戶標簽。
3.根據權利要求2所述的方法,其特征在于,所述獲取所述詞的重要度評分,包括:
將跨領域的用戶數據總份數除以所述用戶數據份數與正的常數的和后取對數,再乘以所述詞頻,獲得所述詞的重要度評分。
4.根據權利要求1所述的方法,其特征在于,所述根據主題生成模型和所述用戶標簽集確定所述用戶標簽集所屬主題,并將所述用戶標簽集所屬主題作為用戶所屬用戶社區,包括:
根據主題生成模型,對于所述用戶標簽集中的每個用戶標簽,按照預設數量的主題與用戶標簽的多項式分布選擇當前用戶標簽所屬的主題,并且按照用戶標簽集與主題的多項式分布生成在選擇的主題條件下的當前用戶標簽,以構建用戶標簽生成概率函數;
獲取所述用戶標簽集中各個用戶標簽的出現概率;
根據獲取的出現概率和所述用戶標簽生成概率函數,獲得所述用戶標簽集屬于預設數量的主題中各主題的概率;
將概率最大的主題確定為用戶所屬用戶社區。
5.根據權利要求1所述的方法,其特征在于,所述方法還包括:
計算待推薦物品與所述用戶所屬用戶社區的相似度;
將所述相似度高于預設閾值的所述待推薦物品推薦給所述用戶所屬用戶社區中的用戶。
6.根據權利要求1所述的方法,其特征在于,所述計算各種特征向量彼此之間的關聯性,包括:
計算所述用戶屬性信息的特征向量與所述跨領域的用戶數據的特征向量的內積,得到所述用戶屬性信息的特征向量與所述跨領域的用戶數據的特征向量的關聯性;
計算所述用戶屬性信息的特征向量與所述用戶所屬用戶社區的特征向量的內積,得到所述用戶屬性信息的特征向量與所述用戶所屬用戶社區的特征向量的關聯性;
計算所述跨領域的用戶數據的特征向量與所述用戶所屬用戶社區的特征向量的內積,得到所述跨領域的用戶數據的特征向量與所述用戶所屬用戶社區的特征向量的關聯性。
7.根據權利要求1所述的方法,其特征在于,所述用戶評分值具體按照以下公式計算:
其中,y是用戶評分值,w0表示全局偏值,wu 表示用戶屬性信息u的權重,wi表示跨領域的用戶數據i的權重,wm表示用戶所屬用戶社區m的權重;vu表示用戶屬性信息u的特征向量,vi表示跨領域的用戶數據i的特征向量,vm表示用戶所屬用戶社區m的特征向量;LDAu表示用戶標簽集與主題的多項式分布中的主題集合,|LDAu|表示LDAu的大小;符號表示求取內積,用于表示特征向量之間的關聯性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司;中山大學,未經騰訊科技(深圳)有限公司;中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610305668.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據解析的方法和裝置
- 下一篇:優化鍵值數據庫的數據存儲結構的方法和裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





