[發明專利]一種基于LDA的加權平均的個性化好友推薦方法在審
| 申請號: | 201710944430.2 | 申請日: | 2017-10-12 |
| 公開(公告)號: | CN107767279A | 公開(公告)日: | 2018-03-06 |
| 發明(設計)人: | 宮繼兵;宋艷青;高小霞;宋雅稀;劉吉輝 | 申請(專利權)人: | 燕山大學 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00;G06F17/30 |
| 代理公司: | 秦皇島一誠知識產權事務所(普通合伙)13116 | 代理人: | 續京沙 |
| 地址: | 066004 河北省*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lda 加權 平均 個性化 好友 推薦 方法 | ||
技術領域
本發明屬于互聯網技術領域,涉及互聯網下的社交網絡推薦,尤其涉及一種基于LDA的加權平均的個性化好友推薦方法。
背景技術
隨著Web2.0技術的蓬勃發展,全球逐漸迎來了社交網絡(SocialNetwork)時代,一些具有代表性的社交網站已成為影響力巨大的信息平臺,如:Facebook,Twitter和新浪微博等。它們將用戶群體和信息結合在一起,使用戶可以便捷地分享和獲取信息,同時也極大地拓展了用戶的社交群體。但是,隨著社交網絡用戶迅速增多,社交網絡中信息量急劇增大,對社交網絡用戶來說,如何在這些龐大的數據中找到合適自己的好友,擴展自己的社交網絡好友圈成為一個難題。
為了解決社交網絡信息量大和好友尋找困難問題,推薦和搜索成為人們關注的焦點。用戶利用好友搜索功能來查找好友以擴大交際圈,但是,這種搜索浪費大量的時間,效率低,并且不具有準確性。而各大社交網絡平臺相繼推出各種推薦策略來滿足用戶需求,但是,目前的推薦算法具有諸多局限性。經典的協同過濾方法,不能很好的解決數據稀疏性問題,考慮的用戶信息也較少,推薦效果不理想。基于標簽的推薦方法,重點考慮了用戶的靜態屬性而忽視了更具社交價值的動態交互行為,從而不能很好的獲取社交網絡用戶的特性,推薦效果也不理想。
已有的好友推薦方法考慮問題單一化,沒有進行用戶特征的全面分析,具有不同程度的局限性,因此,本發明提出了一種綜合地考慮社交網絡用戶的多方面特征,推斷用戶人物畫像,從而進行準確地個性化好友推薦方法。該方法通過將用戶在社交網絡中的結構特征(用戶的動態行為)和用戶節點特征(用戶的靜態屬性)進行加權平均從而計算社交網絡用戶間的相似度;通過用戶間的相似度進行排序,挑選前Top-N個候選用戶;然后,把Top_N個用戶推薦給目標用戶。在本發明中使用了查準率和查全率以及F1-Measure等評估指標對好友推薦進行評估。最后,通過在真實的微博數據集上進行的實驗,進一步驗證了本方法能更準確的進行個性化好友推薦。
發明內容
針對已有推薦方法中沒有綜合考慮社交網絡中用戶的動態行為特征和靜態屬性信息的局限,本發明克服了現有技術中的不足,提供一種基于LDA的加權平均的個性化好友推薦方法。本發明將個性化的好友推薦問題抽象為提取用戶的動態行為特征和靜態屬性信息的問題,利用加權平均的方法對上述兩方面進行綜合建模,獲取用戶間相似度信息,然后,根據用戶間的相似度,挑選出前Top-N個最適合目標用戶的好友,并把這些用戶推薦給目標用戶。
具體地,本發明是通過以下技術方案實現的:
一種基于LDA的加權平均的個性化好友推薦方法,該方法把用戶的節點信息特征和社交網絡結構特征利用加權平均的方法有效結合,建立統一模型的個性化好友推薦方法;所述用戶的節點信息特征是指用戶的靜態屬性;所述社交網絡結構特征是指用戶的動態行為;
其具體內容包括如下步驟:
步驟一:首先,獲取社交網絡中目標用戶t的一度、二度、…m度好友形成候選好友集合C,提取目標用戶和集合C中每個用戶的靜態屬性信息,即每個用戶都具有一個靜態屬性結構,這些靜態屬性信息包括目標用戶和候選用戶間的共同好友數,自身地理位置,以及在社交網中與自身相關的帖子;
步驟二:對于步驟一所述候選用戶相關帖子,利用LDA主題建模的方法,分析候選用戶關注的主題,從而推斷候選用戶的興趣愛好,身份地位和年齡性別信息;然后根據社交網絡目標用戶的靜態屬性,包括目標用戶與候選用戶的共同好友數,目標用戶和候選用戶的地理位置,以及目標用戶和候選用戶關注的“主題”,分別對候選集合中的候選用戶和目標用戶進行了相似度計算,其計算依據如下:
①目標用戶與候選用戶的共同好友數越多,目標用戶與候選用戶的相似度就越高;
②線上行為可能影響線下行為,目標用戶與候選用戶間的地理位置越近,目標用戶與候選用戶間就越容易成為好友;
③目標用戶和候選用戶共同的話題數越多,目標用戶與候選用戶的興趣就越相似,成為好友的可能性也就越大;
在本發明方法中,利用加權平均的方法為上述的各個靜態屬性分別賦予一個權重,同時為了平衡上述靜態屬性在計算社交網絡中目標用戶和候選用戶間相似度的重要程度,使用sigmod的函數對各個特征進行縮放;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于燕山大學,未經燕山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710944430.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種活血化瘀的藥物組合物
- 下一篇:一種治療咽炎的藥物組合物的制備方法





