[發明專利]一種社交網絡群體發現系統、方法及存儲介質在審
| 申請號: | 202010224848.8 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN112445939A | 公開(公告)日: | 2021-03-05 |
| 發明(設計)人: | 沈超;劉笑子;劉曉明;周亞東;管曉宏 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/951;G06Q50/00;G06K9/62;G06N3/04 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 李曉曉 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 網絡 群體 發現 系統 方法 存儲 介質 | ||
本發明公開了一種社交網絡群體發現系統、方法及存儲介質,首先獲取在線社交網絡數據集,建立在線社交網絡拓撲圖;根據在線社交網絡拓撲圖建立鄰接矩陣,利用深度棧式自編碼器對鄰接矩陣進行降維處理,得到降維矩陣;利用圖嵌入方法獲取節點嵌入向量;最后對節點嵌入向量進行聚類,得到聚類結果,即為社交網絡群體發現結果;本發明通過獲取在線社交網絡數據集,提取鄰接矩陣,實現了對在線社交網絡用戶之間關系的描述;通過利用深度棧式自編碼器及圖嵌入,有效保留在線社交網絡結構的完整性,確保了群體發現結果的準確性;通過對降維嵌入后的節點嵌入向量進行聚類,獲取發現結果,降低了時間復雜度,實現了更加快速準確的獲取發現結果。
技術領域
本發明社交網絡分析技術領域,特別涉及一種社交網絡群體發現系統、方法及存儲介質。
背景技術
隨著互聯網的普及和在線社交平臺的發展,各種社交網絡已經在在線社交平臺里得到飛速發展,例如微信的社交群、QQ群體網絡、微博熱點關注網絡或Twitter發推網絡;對于上述社交網絡而言,在線社交網絡的發現已經成為學術界和產業界的熱點話題。
傳統的社交網絡發現方法是根據網絡中用戶與用戶之間的鄰接關系進行聚類,采用較為復雜的算法,將用戶進行劃分社區,比如譜聚類等方法;如果在線社交網絡規模過大,譜聚類計算時間復雜度過高,效果又不理想。
針對上述時間復雜度缺陷,對于大規模在線社交網絡而言,如何確保進行社交網絡發現的時間復雜度低,尋找提高社交網絡發現效率已經成為一種發展趨勢,同時能夠滿足對各類社交網絡進行通用,對各類社交網絡都具有適用性。
發明內容
針對現有技術中存在的不足,本發明的目的在于提供了一種社交網絡群體發現系統、方法及存儲介質,以解決現有技術中計算時間復雜度過高,計算結果不理想的技術問題。
為實現上述目的,本發明的技術方案是:
本發明提供了一種社交網絡群體發現方法,包括以下步驟:
步驟1、獲取在線社交網絡數據集,建立在線社交網絡拓撲圖;
步驟2、對在線社交網絡拓撲圖進行預處理,剔除孤立節點,得到預處理后的在線社交網絡拓撲圖;利用預處理后的在線社交網絡拓撲圖中各個節點對應的鄰接節點,建立在線社交網絡的鄰接矩陣;
步驟3、利用深度棧式自編碼器,對在線社交網絡的鄰接矩陣進行降維處理,得到降維矩陣;利用圖嵌入方法,將降維矩陣中的某一行向量作為社交網絡拓撲圖中對應節點的表示向量,得到節點嵌入向量;
步驟4、利用K-means方法對節點嵌入向量進行聚類,得到聚類結果,即為社交網絡群體發現結果。
進一步的,還包括步驟5,具體為,利用NMI指數對社交網絡群體發現結果進行評估。
進一步的,步驟1中,采用線上爬蟲或直接查找公開數據集方式獲取在線社交網絡數據集;其中,線上爬蟲時,利用社交平臺的應用程序接口,采用爬蟲框架爬取用戶信息、關注信息及轉發信息;
在線社交網絡拓撲圖的表達式如下:
G=(V,E)
其中,G為社交網絡拓撲圖,其節點個數為n;V為拓撲圖G中節點的集合;E為拓撲圖G中邊的集合。
進一步的,步驟2中,當在線社交網絡拓撲圖G中的節點個數為n時,鄰接矩陣A的數學表達式為:
其中,若Ai,j=1,i∈[0,n-1],j∈[0,n-1],則社交網絡拓撲圖G中第i個節點與第j個節點為相鄰節點,若Ai,j=0,i∈[0,n-1],j∈[0,n-1],則社交網絡拓撲圖G中第i個節點與第j個節點為不相鄰節點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010224848.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:腳手架部件及腳手架部件的連結結構
- 下一篇:光學檢測裝置





