[發明專利]一種基于社會關系主題模型的社交網絡朋友推薦方法在審
| 申請號: | 201610047668.0 | 申請日: | 2016-01-22 |
| 公開(公告)號: | CN105740342A | 公開(公告)日: | 2016-07-06 |
| 發明(設計)人: | 譚鐵牛;王亮;吳書;郭韋昱 | 申請(專利權)人: | 天津中科智能識別產業技術研究院有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 天津市三利專利商標代理有限公司 12107 | 代理人: | 韓新城 |
| 地址: | 300465 天津市濱海新區天津經濟技*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社會關系 主題 模型 社交 網絡 朋友 推薦 方法 | ||
技術領域
本發明涉及互聯網產品的信息推薦技術領域,具體涉及一種基于社會關系主題模型的社交網絡朋友推薦方法。
背景技術
隨著互聯網技術與在線社交網絡的快速發展,從大量的用戶生成內容(User-generatedContent,簡稱UGC)和豐富的用戶社交關系信息中挖掘用戶的主題興趣,逐漸在線市場營銷技術的重要組成。
用戶生成內容泛指以任何形式在網絡上發表的由用戶創作的文字、圖片、音頻、視頻等內容,本發明主要針對用戶在社交網絡平臺上發表的文本狀態信息進行分析,比如用戶發表的微博,博客和論文等。并將這些文本信息與用戶的社交網絡進行結合,綜合分析用戶在社交網絡平臺上所隱含著的主題興趣。
近年來,許多基于傳統文本分析的主題模型(比如PLSA、LDA等)被改進并應用到社交網絡場景中,如Link-LDA、RTM和RankTopic。這些模型大多假設用戶在社交網絡中產生的關系,都是基于用戶主題興趣的。然而,實際情況是,隨著社交網絡平臺的商業影響力的不斷提升,大量的非主題因素(如名人效應,廣告營銷)產生的社交關系充斥著在線社交網絡。傳統的主題模型(如PLSA、LDA),通常只考慮文本內容,而不能處理用戶的社交關系。即便是最近的一些結合了文本關系的主題模型(Link-LDA、RTM和RankTopic),由于沒有考慮用戶社交關系產生原因中的非主題因素,這些方法在也很難準確地挖掘出社交網絡平臺上用戶的主題興趣。
發明內容
本發明著眼于克服上述的技術缺陷,提出一種基于社會關系主題模型的社交網絡朋友推薦方法,其可以綜合利用用戶在社交網絡平臺上發表的狀態和用戶的社交網絡關系,準確分析用戶主題興趣及在線建立社會關系行為模式,學習用戶主題興趣分布,挖掘用戶的主題興趣,并利用相關學習到的模型參數進行朋友推薦,使得在社交網絡平臺上進行朋友推薦更加符合用戶的需要。
本發明是這樣實現的,一種基于社會關系主題模型的社交網絡朋友推薦方法,包括以下步驟:
S1,收集用戶在社交平臺上發表的狀態,利用詞袋法為每個用戶建立一個用戶關鍵詞文檔;
S2,獲取用戶的線上社交網絡關系,為每個用戶建立一個用戶社交關系文檔;
S3,將用戶關鍵詞文檔和社交關系文檔作為輸入數據,利用社會關系主題模型學習每個輸入用戶的主題興趣和在線建立社交關系的行為模式;
S4,根據社會關系主題模型參數的學習結果,挖掘數據集合中蘊含的主題信息,為各個主題挖掘出相關的關鍵詞和輿論領袖;
S5,根據用戶的主題興趣和用戶在線建立社交關系的行為模式,為用戶推薦潛在的朋友,并以相關主題的關鍵詞和輿論領袖闡釋推薦依據。
本發明利用用戶發表的狀態信息和社交關系信息,挖掘用戶的主題興趣分布,引入了社會關系主題模型學習分析用戶的主題興趣與在線建立社交關系的行為模式,并根據用戶的主題興趣與在線建立社交關系的行為模式,為用戶推薦潛在的朋友,使得算法在為用戶推薦朋友時能夠綜合考慮用戶興趣、在線建立社交關系的行為模式以及推薦結果可理解性等多方面因素,推薦結果更符合用戶的需要,并具有可理解性。
本發明不僅可以被用來進行基于在線社交網絡的朋友推薦,還可用于挖掘社交媒體上具體用戶的主題興趣,社交網絡的主題以及各個主題下的輿論領袖和主題關鍵詞。
本發明能夠綜合利用用戶生成文本信息和社交網絡的分析,比較全面的分析出社交網絡上各個用戶的主題興趣,并且利用文本關鍵詞和社交網絡中的輿論領袖來直觀的闡釋用戶的主題興趣。
附圖說明
圖1是本發明實施例提供的基于社會關系主題模型的社交網絡朋友推薦方法的流程圖;
圖2是本發明實施例提供的社交關系主題模型SRM的圖模型表示;
圖3是本發明的社交關系主題模型SRM在主題個數分別給定(k=32,k=64)的前提下進行朋友推薦的平均精確度MAP性能展示;
圖4是本發明的社交關系主題模型SRM與其他模型基于新浪微博數據進行朋友推薦任務的AUC指標展示。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本發明進一步詳細說明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津中科智能識別產業技術研究院有限公司,未經天津中科智能識別產業技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610047668.0/2.html,轉載請聲明來源鉆瓜專利網。





