[發明專利]一種用戶聚類的異構社交網絡推薦的方法在審
| 申請號: | 201610588511.9 | 申請日: | 2016-07-25 |
| 公開(公告)號: | CN107656928A | 公開(公告)日: | 2018-02-02 |
| 發明(設計)人: | 余漫游 | 申請(專利權)人: | 長沙有干貨網絡技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410011 湖南省長沙市芙蓉區*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 社交 網絡 推薦 方法 | ||
技術領域
本發明是一種互連網技術,尤其涉及GCCR。
背景技術
社交網絡(Social Networks Services, SNS)隨著Internet用戶的普及呈現出飛速發展的趨勢,不僅用戶數量爆炸性地增長,其服務形態也在發生急劇的變化.近年來,大量新型的社交網絡服務不斷地涌現,其中以國外Twitter和國內新浪微博為代表的弱關系社交網絡微博服務(Micro Blog)正成為一種主要的社交網絡形態。
發明內容
GCCR算法旨在根據弱關系社交網絡中用戶對不同主題的興趣程度,為用戶推薦其可能喜歡的主題內容.通過分析從用戶-主題喜好矩陣和用戶自身發表內容的中體現出的用戶喜好信息,并將二者綜合利用,提高在稀疏數據集上的推薦效果.同時利用圖摘要算法中的類模糊性,保證冷啟動條件下推薦的多樣性。
GCCR主要步驟包括預處理、核心聚類、全用戶聚類、主題推薦階段,主要流程如下:
(1)預處理階段,篩選出興趣向量非零值比例大于密度閡值幾的核心用戶集合,根據核心用戶對應的興趣向量提取構造出原興趣矩陣的密集子矩陣;
(2)核心聚類階段,根據核心用戶的興趣矩陣構成的訂閱關系圖進行圖摘要計算,利用摘要迭代的過程生成滿足模糊度和獨立性約束的核心聚類;
(3)全用戶聚類階段.利用上一步中生成的核心聚類,提取核心聚類內容特征向量,同時提取非核心用戶所發表微博的內容特征向量,根據內容特征向量的相似度不斷迭代,將非核心用戶加入到己有的聚類集合中,直至完成對所有用戶的聚類;
(4)根據聚類結果以及每個用戶在聚類內部的相似度和類興趣特征,生成類成員內部的推薦向量,同時根據不同主題在不同聚類間的興趣差異,形成跨類推薦向量,兩者綜合排序之后的結果作為最終推薦結果;
推薦算法執行過程中,對于訓練數據集進行(1)~(3)離線計算生成聚類結果和類興趣向量,對于任何新加入的用戶,只需進行(3)中的聚類歸屬計算和(4)中的推薦過程,通過將離線和在線處理運算盡可能的分離,可以使算法達到更高的在線推薦計算效率。
用戶聚類的異構社交網絡推薦算法GCCR技術如下:
1問題建模:
(1)對于N個用戶,M個主題,可分別表示為用戶集u={u1,u2 ,…,uz}討與主題集S={S1,S2 ,…,Sm},對于每個用戶ui,有對應興趣向量Vi=( a1,a2 ,…,am)所有用戶的興趣向量可構成NXM的興趣矩陣m,對于存在訂閱關系的用戶ui和主題sj,對應元素aij>0,表示用戶uj對主題sj興趣度,如不存在訂閱關系,則對應aij=0;
(2)基于興趣矩陣m的興趣圖Gm可表示為有向圖G<V,E),其中V為用戶和主題節點構成的集合:V=UUS,E為訂閱關系構成的邊集合: E={e(ui,sj)?ui ?U,sj?S,aij>0};
(3)對于每個用戶ui,定義其興趣密度值des (ui)為興趣向量vi中非零元素所占的比例,那么對于des (ui)大于密度閡值λ (通常取10%)的用戶ui定義為核心用戶,那么核心用戶集合可定義為U' ={ ui?ui ?U,des(ui)> λ};
由核心用戶興趣向量構成的興趣矩陣為密集子矩陣m‘,基于密集子矩陣可構造出核心興趣圖Gm’。
核心聚類,圖摘要算法通常用于從擁有大量節點的復雜圖中提取隱含信息,發現主體結構和普遍規律,不同于以往基于統計的圖摘要方法:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙有干貨網絡技術有限公司,未經長沙有干貨網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610588511.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種特征選擇方法及設備
- 下一篇:一種部門間信息共享與服務平臺的數據組織方法





