[發明專利]基于評分LDA的協同過濾算法在審
| 申請號: | 202110238102.7 | 申請日: | 2021-03-04 |
| 公開(公告)號: | CN112905908A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 陳道泉;周秀澤 | 申請(專利權)人: | 浙江機電職業技術學院 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/958;G06Q30/06 |
| 代理公司: | 溫州青科專利代理事務所(特殊普通合伙) 33390 | 代理人: | 錢磊 |
| 地址: | 310000 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 評分 lda 協同 過濾 算法 | ||
本發明公開了基于評分LDA的協同過濾算法,對所需進行評價的商品建立相關的用戶參數,設置參數K為“興趣個數”、參數R為“評分數目”、參數M為“用戶人數”,且設置參數Θ表示興趣的多項式分布,參數Ω表示在給定興趣的情況下關于商品的多項式分布,設置Φ表示在給定興趣的情況下關于評分的多項式分布,并額外設置α,β和λ分別表示Θ,Φ和Ω的超參,計算出用戶對于某個商品評分的概率P(i,r|u),然后根據P(i,r|u)來進行排序生成推薦列表。本申請所提出的RLDA算法和其他對比方法最大的不同點在于本文的模型是將評分因素直接加入模型,而不是分兩步計算,在整體的計算過程中受稀疏性的影響較小,使得算法的準確性與可參考性得到顯著提升。
技術領域
本發明屬于LDA算法技術領域,更具體地說,尤其涉及基于評分LDA的協同過濾算法。
背景技術
推薦系統的核心是推薦算法。算法的優劣,直接關系到推薦系統的質量。為了使推薦系統更好地滿足消費者的需求,近年來,學者們提出了很多推薦算法。本節主要對與本文相關的算法進行介紹和分析,包括奇異值分解(SVD),潛在狄利克雷(LDA)模型和iExpand算法。
隨著潛在興趣或潛在因素的增長,每個算法的效果均有所減弱,特別是SVD_Pure(即SVD算法,加Pure后綴是為了與后文的近鄰相區別)算法。當k值較大的時候,隨著k的增大,各個算法的效果均變差。主要是因為k的增大使這些算法過擬合。大多數情況下,本文的算法性能優于其他對比算法。隨著潛在興趣或潛在因子數目增長,RLDA的曲線和SVD_Neib(基于近鄰的SVD)的曲線表現非常相像,都明顯好于其他幾個對比算法,特別是當潛在興趣或潛在因子數目大的時候。但是,潛在興趣或潛在因子數目增大RLDA和SVD_Neib的影響很小。反觀其他的對比算法,隨著潛在興趣或潛在因子數目的增大,曲線急劇下降。潛在因素的增大,SVD_Pure容易過擬合,而SVD_Neib由于采用近鄰的原因,具有很強的適應性。iExpand算法的曲線因為是基于LDA模型,所以曲線的走勢和LDA很像。這也就意味著,iExpand算法的性能很大程度上取決于LDA模型。且各個算法在數據集Movielens100K上的表現要比在數據集Movielens1M上要好。這要原因是數據集Movielens1M的稀疏度比Movielens100K要大:數據集Movielens100K的稀疏度是6.3%,數據集Movielens1M的稀疏度是4.2%。每個算法都受數據稀疏性的影響。
發明內容
本發明的目的是為了解決現有技術中存在的缺點,提出的RLDA算法將評分因素直接加入模型,而不是分兩步計算,在整體的計算過程中受稀疏性的影響較小,使得算法的準確性與可參考性得到顯著提升。
為實現上述目的,本發明提供基于評分LDA的協同過濾算法,包括如下步驟:
S1、對所需進行評價的商品建立相關的用戶參數,設置參數K為“興趣個數”、參數R為“評分數目”、參數M為“用戶人數”;
S2、基于獨立的假設,可以得到興趣,商品和評分的聯合分布,如下所示:
P(t,i,r|α,β,λ)=P(t|α,β,λ)·P(i,r|α,β,λ)=P(t)·P(i|t)·P(r|t)=Θt·Φt,i·Ωt,r;
其中Θ為用戶-興趣的多項式分布,Φ為興趣-商品的多項式分布,以及Ω興趣-評分的多項式分布;
S3、在狀態j的情況下,用和來依次分別表示第k個興趣,第i個商品,第r個評分和第u個用戶,使用T表示興趣、N表示商品以及R表示評分的數目,再利用和分別表示屬于用戶u的興趣數目,商品分配給興趣t的數目,評分分配給興趣t的數目,根據以上參數以及α,β和λ分別表示Θ,Φ和Ω的狄利克雷先驗分布參數,然后計算它們條件概率:
此時可以得到用戶-興趣的分布Θ,興趣-商品的分布Φ以及興趣-評分的分布Ω:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江機電職業技術學院,未經浙江機電職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110238102.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種銑削設備的自動上料架
- 下一篇:一種適口性好寵物飼料制備系統及制備方法





