[發明專利]基于在線軟約束LDA算法的社區推薦方法無效
| 申請號: | 201010284218.6 | 申請日: | 2010-09-10 |
| 公開(公告)號: | CN101968798A | 公開(公告)日: | 2011-02-09 |
| 發明(設計)人: | 俞能海;康雨潔 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 230026*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 在線 約束 lda 算法 社區 推薦 方法 | ||
技術領域
本發明涉及個性化推薦方法,特別涉及一種基于在線軟約束LDA算法的社區推薦方法。
背景技術
近幾年來,社會網絡大批涌現。這些網頁為用戶提供了建立社區的工具,使得志同道合的用戶們可以聚集在一起,互相分享他們感興趣的信息。隨著這種社會網絡服務的快速增多,用戶們面對海量的各種各樣主題的社區,會產生迷惑,如何才能有效率的選擇自己所感興趣的社區呢?于是,社區推薦逐漸成為一個很重要的技術。
目前常見的個性化推薦方法有兩種:一種是基于內容的推薦方法,一種是協同推薦。基于內容的推薦方法,先利用每位用戶對對象的評論或者投票行為為該用戶訓練一個偏好模型,然后再利用這個偏好模型給用戶推薦他可能最感興趣的一個新的對象。協同推薦是建立在如下假設的基礎上的:相似的用戶有相同的喜好。當使用協同推薦的方法給用戶推薦對象時,只需要參考與該用戶相似的用戶的喜好。因此這種方法不需要獲得對象的內容信息,可以在缺乏對對象的描述的情況下,進行推薦。
在目前已有的社區推薦的算法中,有兩種知名的基于協同推薦的方法:ARM方法和二值的LDA方法。ARM方法利用不同社區之間有多少重疊的用戶來推算社區之間的相互關系。二值的LDA方法通過社區-用戶共生矩陣來計算社區之間的潛在主題。這兩種方法容易遇到由于數據觀察的限制所導致的過擬合現象以及計算量龐大的問題。并且這兩種方法都忽略了用戶與社區之間的關系強弱,也不能處理新加入的用戶。
發明內容
本發明的目的在于,解決現有的社區推薦方法所容易遇到的由于數據觀察的限制所導致的過擬合現象以及計算量龐大的問題。
為達到上述目的,本發明提供一種基于在線軟約束LDA算法的社區推薦方法,包括計算主題分布、計算最優候選社區、在線更新三大步驟。
所述的計算主題分布步驟為:
步驟a,對于單個用戶,抓取其在各個小社區上的發帖信息,分別統計其發帖次數,作為用戶與社區關系的衡量標準,用第i個用戶Ui在他所參與的第j個社區Ci,j上的發帖次數作為用戶Ui與社區Ci,j的關系強弱度,用Ri,j表示;
步驟b,將用戶視為文檔,用戶參與的社區視為文檔中的單詞,而Ri,j就是社區單詞Ci,j在用戶文檔Ui中的出現次數,用LDA算法建立用戶主題分布以及主題社區分布模型,并用Gibbs采樣方法求解模型參數,求解的具體過程為:
先為所有的用戶文檔中出現的社區單詞,隨機分配一個主題集合,如為社區單詞Ci,j分配主題集合再利用迭代公式更新所有的主題,直到模型參數收斂:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010284218.6/2.html,轉載請聲明來源鉆瓜專利網。





