[發明專利]基于用戶興趣主題的微博網絡鏈路預測方法、裝置及介質有效
| 申請號: | 202010548003.4 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111859163B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 丁大釗;張建軍;鮑尚策;王文重;楊鵬飛;張志航 | 申請(專利權)人: | 珠海高凌信息科技股份有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06Q50/00 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 伍志健 |
| 地址: | 519060 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 興趣 主題 網絡 預測 方法 裝置 介質 | ||
本發明涉及一種基于用戶興趣主題的微博網絡鏈路預測方法、裝置及介質,本發明的技術方案通過爬取微博網絡數據并建立用戶網絡拓撲,將所爬取的用戶微博內容匯集成語料文檔;通過社會三元關系理論篩選二級好友,得到擁有共同關注的微博用戶;對所述語料文本進行文本建模,通過LDA聚類用戶語料文檔詞匯及主題特征;算所述主題特征的概率分布,并構建用戶興趣主題模型;通過KL距離計算所述二級好友的集合間的興趣主題相似度,并按比例取相似用戶作為預測結果。本發明的有益效果為:借助真實微博語料庫在潛在好友中依據微博內容提取用戶興趣主題,發現相似用戶,并進一步預測用戶網絡的未來連接,針對微博網絡下具有更好的預測效果。
技術領域
本發明涉及社交網絡及數據分析領域,具體涉及了一種基于用戶興趣主題的微博網絡鏈路預測方法、裝置及介質。
背景技術
微博是近些年來迅速發展壯大的在線社交分享平臺,因其內容分享迅速、便捷的特點吸引了大量活躍用戶。用戶之間的關注、轉發、點贊等交互行為組建了極具價值的微博網絡。面向微博網絡的輿情分析、熱點推送、好友推薦等技術為運營者提供了眾多服務手段用以改善用戶體驗,也成為數據分析行業人員研究分析的得力工具。鏈路預測技術是網絡科學之重要分支,其旨在通過網絡已知信息預測尚未發現或即將產生的連邊。微博網絡的預測即指借助用戶關注、微博轉發等數據預知下一時刻可能發生關注行為的用戶對,為用戶推薦具有相同興趣的相似好友。
發明內容
本發明的目的在于至少解決現有技術中存在的技術問題之一,提供了一種基于用戶興趣主題的微博網絡鏈路預測方法、裝置及介質,預測效果更好。
本發明的技術方案包括一種基于用戶興趣主題的微博網絡鏈路預測方法,其特征在于,該方法包括:S100,爬取微博網絡數據并建立用戶網絡拓撲,將所爬取的用戶微博內容匯集成語料文檔;S200,通過社會三元關系理論篩選二級好友,得到擁有共同關注的微博用戶;S300,對所述語料文本進行文本建模,通過LDA聚類用戶語料文檔詞匯及主題特征;S400,計算所述主題特征的概率分布,并構建用戶興趣主題模型;S500,通過KL距離計算所述二級好友的集合間的興趣主題相似度,并按比例取相似用戶作為預測結果。
根據所述的基于用戶興趣主題的微博網絡鏈路預測方法,其特征在于,其中S100包括:爬取微博網絡數據并建立用戶網絡拓撲G(V,E),以鄰接矩陣A表示;同時將用戶微博內容匯集成語料文檔D(U,B),其中U=(u1,u2,…,un)表示用戶集合,每個用戶ui的微博內容按時序匯集為語料庫(bu,1,bu,2,…,bu,M),每條微博內容bu,i來自用戶ui分享或轉發。
根據所述的基于用戶興趣主題的微博網絡鏈路預測方法,其特征在于,其中S200包括:應用社會三元關系理論在網絡拓撲內篩選二級好友,即獲取擁有共同關注的微博用戶,通過矩陣運算操作為A·A,通過aih表示用戶i與用戶h存在共同關注好友數量,矩陣運算的行向量即表示該用戶的二級好友集合。
根據所述的基于用戶興趣主題的微博網絡鏈路預測方法,其特征在于,其中S300包括:進行文本建模,利用LDA提取用戶語料文檔的詞袋向量d=(ω1,ω2,…,ωn),具體包括:S301,計算文檔的詞匯矩陣,對每個用戶微博文檔內容進行詞匯統計,詞wj在文檔bu,i中出現的頻率填充到對應的矩陣位置;S302,計算主題的詞匯矩陣,在語料庫中隨機指定主題編號zi,計算每個zi下出現的詞匯頻率;S303,計算文檔的主題矩陣,統計每個詞代表的主題在每一個文檔中出現的次數,得出用戶的微博文檔的對應主題矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海高凌信息科技股份有限公司,未經珠海高凌信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010548003.4/2.html,轉載請聲明來源鉆瓜專利網。





