[發(fā)明專利]信息推薦方法和裝置有效
| 申請?zhí)枺?/td> | 201610305668.6 | 申請日: | 2016-05-10 |
| 公開(公告)號: | CN107357793B | 公開(公告)日: | 2020-11-27 |
| 發(fā)明(設(shè)計)人: | 鄭子彬 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司;中山大學(xué) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/955 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 推薦 方法 裝置 | ||
本發(fā)明涉及一種信息推薦方法和裝置,所述方法包括:根據(jù)跨領(lǐng)域的用戶數(shù)據(jù)提取用戶標(biāo)簽;將相同用戶的所述用戶標(biāo)簽形成用于描述所述用戶的用戶標(biāo)簽集;根據(jù)主題生成模型和所述用戶標(biāo)簽集確定所述用戶標(biāo)簽集所屬主題,并將所述用戶標(biāo)簽集所屬主題作為用戶所屬用戶社區(qū);根據(jù)所述用戶所屬用戶社區(qū)進(jìn)行信息推薦。本發(fā)明提供的信息推薦方法和裝置,在數(shù)據(jù)稀疏度高的情況下可根據(jù)跨領(lǐng)域的用戶數(shù)據(jù),利用主題生成模型準(zhǔn)確地確定用戶所屬用戶社區(qū),從而再利用用戶所屬用戶社區(qū)進(jìn)行信息推薦,可以在數(shù)據(jù)稀疏度高的情況下仍然進(jìn)行準(zhǔn)確的信息推薦。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,特別是涉及一種信息推薦方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展,信息快速增長,如何對信息進(jìn)行有效的篩選和過濾,將用戶感興趣的信息,比如電影、商品或者食物等信息,準(zhǔn)確地推薦給用戶是一個重要的研究題目。
目前普遍使用的推薦算法包括基于相似性的協(xié)同過濾算法、矩陣分解等,此類算法基于相似用戶或者相似項目等各種類型信息,實現(xiàn)某用戶對某項目的個性化喜愛程度的預(yù)測,從而達(dá)到個性化推薦的效果。
然而,目前的推薦算法只使用用戶的單個活動場景的數(shù)據(jù),具有局限性,特別是在數(shù)據(jù)稀疏度高的情況下,推薦效果差。比如購物網(wǎng)站上的物品可以達(dá)到上百萬件,但是與某一用戶有關(guān)系(比如瀏覽、購買等)的商品可能只有幾十件。以用戶和物品這兩個維度來構(gòu)建關(guān)系矩陣的話,橫軸代表用戶,縱軸代表商品。如果用戶瀏覽或購買某一個商品,其矩陣中對應(yīng)值為1,否則為0,那么這個矩陣幾乎都是0。這樣的情況下用協(xié)同過濾等一些傳統(tǒng)的算法就非常的低效,預(yù)測不準(zhǔn)確,導(dǎo)致推薦結(jié)果也不準(zhǔn)確。
發(fā)明內(nèi)容
基于此,有必要針對目前的推薦算法在數(shù)據(jù)稀疏度高的情況下推薦結(jié)果不準(zhǔn)確的問題,提供一種信息推薦方法和裝置。
一種信息推薦方法,所述方法包括:
根據(jù)跨領(lǐng)域的用戶數(shù)據(jù)提取用戶標(biāo)簽;
將相同用戶的所述用戶標(biāo)簽形成用于描述所述用戶的用戶標(biāo)簽集;
根據(jù)主題生成模型和所述用戶標(biāo)簽集確定所述用戶標(biāo)簽集所屬主題,并將所述用戶標(biāo)簽集所屬主題作為用戶所屬用戶社區(qū);
將概率最大的主題確定為用戶所屬用戶社區(qū);
根據(jù)所述用戶所屬用戶社區(qū)進(jìn)行信息推薦。
一種信息推薦裝置,所述裝置包括:
用戶標(biāo)簽提取模塊,用于根據(jù)跨領(lǐng)域的用戶數(shù)據(jù)提取用戶標(biāo)簽;將相同用戶的所述用戶標(biāo)簽形成用于描述所述用戶的用戶標(biāo)簽集;
用戶所屬用戶社區(qū)確定模塊,用于根據(jù)主題生成模型和所述用戶標(biāo)簽集確定所述用戶標(biāo)簽集所屬主題,并將所述用戶標(biāo)簽集所屬主題作為用戶所屬用戶社區(qū);將概率最大的主題確定為用戶所屬用戶社區(qū);
信息推薦模塊,用于根據(jù)所述用戶所屬用戶社區(qū)進(jìn)行信息推薦。
上述信息推薦方法和裝置,利用跨領(lǐng)域的用戶數(shù)據(jù)來提取用戶標(biāo)簽,同一用戶的用戶標(biāo)簽構(gòu)成描述用戶畫像的用戶標(biāo)簽集,這樣每個用戶標(biāo)簽集都可以準(zhǔn)確地代表相應(yīng)的用戶。主題生成模型是處理自然語言的一種工具,利用該主題生成模型確定的用戶所屬用戶社區(qū),可準(zhǔn)確表示出用戶所在的用戶社區(qū),可表達(dá)用戶與其它用戶共有的特征。再利用用戶所屬用戶社區(qū)進(jìn)行信息推薦,便可以在數(shù)據(jù)稀疏度高的情況下仍然進(jìn)行準(zhǔn)確的信息推薦。
附圖說明
圖1為一個實施例中信息推薦系統(tǒng)的應(yīng)用環(huán)境圖;
圖2為一個實施例中服務(wù)器的內(nèi)部結(jié)構(gòu)示意圖;
圖3為一個實施例中信息推薦方法的流程示意圖;
圖4為一個實施例中根據(jù)跨領(lǐng)域的用戶數(shù)據(jù)提取用戶標(biāo)簽的步驟的流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司;中山大學(xué),未經(jīng)騰訊科技(深圳)有限公司;中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610305668.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





