[發明專利]一種基于網絡表征學習和鄰居合力的微博用戶社區發現方法有效
| 申請號: | 201910802017.1 | 申請日: | 2019-08-28 |
| 公開(公告)號: | CN110569415B | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 楊旭華;王晨 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06Q50/00 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡 表征 學習 鄰居 合力 用戶 社區 發現 方法 | ||
一種基于網絡表征學習和鄰居合力的微博用戶社區發現方法,根據現有微博數據,建立微博網絡,基于網絡表征學習方法把微博網絡轉化為歐氏空間向量;計算微博網絡中節點的質量以及節點的鄰居合力;通過鄰居合力計算微博網絡中節點的鄰居合力中心性,設定為初始社區的中心節點,其余節點設定為普通節點;將普通節點歸屬到與其最近的中心節點所代表的社區形成微博網絡的初始社區結構;根據模塊度最優的原則合并初始社區,形成最終的微博網絡社區結構。本發明綜合考慮網絡節點的鄰居合力和節點間的距離,提高了社區發現的速度和精度。
技術領域
本發明涉及網絡科學領域,特別是一種基于網絡表征學習和鄰居合力的微博用戶社區發現方法。
背景技術
互聯網的飛速發展極大地推動了社會信息的網絡化進程,以微博為代表的社交網絡已經成為人們日常工作和生活的重要組成部分。微博具有很強的原創性、快捷性、交互性,為每一個網絡用戶都提供了自我展示的平臺,因而迅速吸引了大量用戶。微博中的用戶社區是微博社交網絡中的一種非實體網絡,社區內部的成員往往具有相同或相似的興趣愛好。
從復雜的社交網絡中發現所包含的網絡社區可以引導用戶找到與自己擁有相同興趣愛好的其他用戶,可以幫助微博平臺根據同一社區內用戶的興趣愛好準確地將廣告投放給用戶,也可以為用戶提供更加準確的個性化推薦。同時,準確地發現微博的用戶社區對網絡輿情的高效監管具有重要意義。社區發現旨在找出網絡中的固有社區結構,但由于社交網絡的復雜性,人工的找出網絡中的社區結構難度大且效率低。
目前已經有許多社區發現的方法應用于社交網絡,如層次聚類方法,標簽傳播方法,隨機游走方法等。這些方法對于復雜的社區結構的發現效率較低且不夠準確,常常將其他社區的用戶劃分到同一社區。為了更準確快速地在網絡中發現用戶社區結構,本發明提出了一種基于網絡表征學習和鄰居合力的微博用戶社區發現方法,利用網絡表征學習方法轉化微博網絡拓撲結構,通過網絡節點的鄰居合力找取社區中心并劃分社區。
發明內容
為了克服目前在社交網絡的社區發現方法存在的效率較低和準確性不高等方面的不足,本發明提出了一種快速高效的基于網絡表征學習和鄰居合力的微博用戶社區發現方法。
本發明解決其技術問題所采用的技術方案是:
一種基于網絡表征學習和鄰居合力的微博用戶社區發現方法,包括如下步驟:
步驟一:根據現有的微博數據,一個用戶用一個節點表示;如果兩個用戶存在彼此之間的關注,則兩個用戶之間有一條連邊;構建具有N個節點的微博網絡模型G(V,E),V表示節點,E表示節點之間連邊;
步驟二:采用DeepWalk網絡表征學習方法將具有N個節點的微博網絡G轉化為歐氏空間的N個r維向量,一個網絡節點及其連邊信息對應一個向量,其中第i個向量表示為r為大于或等于2的整數;
步驟三:任意選取微博網絡中兩個節點i和j,計算這兩個節點的距離,該距離為相應的向量和之間的歐式距離;遍歷整個微博網絡,計算所有節點對之間的距離;
步驟四:將微博網絡中的節點看成有質量的節點,計算微博網絡中任意節點i的質量
其中,mi表示節點i的質量,k表示節點i在微博網絡G中的直接鄰居節點的數量;Dij表示節點i與節點j之間的距離;
步驟五:計算任意節點i的鄰居合力
其中表示節點i的鄰居合力,k表示節點i在微博網絡G中的直接鄰居節點的數量,為單位向量,其方向為節點i指向節點j;
步驟六:計算任意節點i的鄰居合力中心性
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910802017.1/2.html,轉載請聲明來源鉆瓜專利網。





