[發明專利]推薦信息生成方法與裝置在審
| 申請號: | 201810041224.5 | 申請日: | 2018-01-16 |
| 公開(公告)號: | CN110110205A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 李偉;孫俊;葉璐;黃正元;徐文文;龔杰 | 申請(專利權)人: | 北京京東金融科技控股有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 闞梓瑄;王衛忠 |
| 地址: | 100176 北京市北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 推薦信息 用戶行為數據 權重 對象生成 算法輸出 用戶提供 算法 | ||
本公開提供一種推薦信息生成方法與裝置。推薦信息生成方法包括:設置多個推薦算法的多個權重值;根據用戶行為數據獲取所述多個推薦算法輸出的多組待推薦對象,所述用戶行為數據包括用戶對多個對象的行為種類以及行為次數;根據所述多個權重值以及所述多組待推薦對象生成對所述用戶的推薦信息。本公開提供的推薦信息生成方法可以提高用戶驚喜度,為用戶提供更符合需求的推薦對象。
技術領域
本公開涉及機器學習技術領域,具體而言,涉及一種推薦信息生成方法與裝置。
背景技術
隨著互聯網尤其是移動互聯網的興起,在海量的信息和數據中挖掘有價值的信息呈獻給用戶,成為電商、社交、新聞、影音等各大主流應用的核心功能。推薦系統是為用戶推薦所需物品的軟件工具和技術,對于在線用戶處理信息過載是一個非常有價值的方法,并且是電子商務領域最強大和流行的工具。
現有的推薦系統一般都采用單一推薦算法來實現整個系統,包括基于協同過濾的推薦算法和基于內容的推薦算法等。現有的協同過濾推薦算法是在海量的用戶數據中找到和某用戶興趣一致的數據,收集用戶的打分數據,將與打分高的商品相似度較大的用戶或者物品作為推薦結果。基于內容的推薦算法是根據用戶歷史瀏覽記錄向其推薦未瀏覽過的物品。現有的基于內容的推薦算法一般采用的是TF-IDF算法,TF指詞頻(Term Frequency),IDF指逆向文件頻率(Inverse Document Frequency),即如果某個詞或短語在一篇文章中出現的頻率TF高,并且在其他文章中很少出現,則認為此詞或者短語具有很好的類別區分能力,適合用來分類。
現有技術一般均采用單一推薦算法進行推薦系統的搭建,但每種算法都有其局限性。協同過濾算法往往存在評價矩陣稀疏、冷啟動等問題。協同過濾算法的實現首先需要使用用戶-評分矩陣對用戶信息進行描述,對于數據量巨大的電子商務網站而言,用戶購買商品的總量占網站總商品量的很小一部分,而用戶只有在購買商品之后,才會對已購買的商品進行打分,因此現有的協同過濾算法采用的評價矩陣(用戶-矩陣)非常稀疏。在大數據量而且評價矩陣稀疏的情況下,難以發現最近鄰居用戶集,并且相似度的計算量也會很大。由于傳統的協同過濾推薦是基于相似用戶或者相似物品計算來得到目標用戶的推薦的,在一個新物品第一次出現的時候,因為沒有用戶對它作過評價,單純的協同過濾無法對其進行預測評分和推薦。而且,在用戶評價較少的情況下,推薦的準確性也比較差。相同的,在新用戶還沒有購買過任何一件商品之前,都不會有和這個新用戶相關的用戶-物品評分,協同過濾算法也就無法給新用戶推薦商品。
基于內容的算法中,TF-IDF是單純基于概率統計來計算向量的一種方式,但是由于詞匯存在同義詞、近義詞和多義詞等概念,同一個詞在不同的上下文環境中也許會代表著截然不同的兩個意思。例如“蘋果”一詞,在描述手機相關的文章里,蘋果代表生產iphone手機的蘋果公司,但是描述在農產品、水果的文章里,蘋果代表的就是水果。所以,單純的以概率統計的值作為向量來計算會存在同義詞、近義詞誤判等問題。此外,基于內容的推薦算法還會出現推薦結果過擬合的問題。例如用戶購買過“襪子”這種商品,算法就會把衣帽生活用品算成是用戶的興趣偏好,那么接下來的推薦就會多次出現襪子、內衣等商品。這樣就會給用戶帶來不好的購物體驗。
因此,需要一種能給用戶帶來更高驚喜度、推薦更符合用戶需求的推薦信息生成方法。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的目的在于提供一種推薦信息生成方法與推薦信息生成裝置,用于至少在一定程度上克服由于相關技術的限制和缺陷而導致的一個或多個問題。
根據本公開實施例的第一方面,提供一種推薦信息生成方法,包括:設置多個推薦算法的多個權重值;根據用戶行為數據獲取所述多個推薦算法輸出的多組待推薦對象,所述用戶行為數據包括用戶對多個對象的行為種類以及行為次數;根據所述多個權重值以及所述多組待推薦對象生成對所述用戶的推薦信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東金融科技控股有限公司,未經北京京東金融科技控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810041224.5/2.html,轉載請聲明來源鉆瓜專利網。





