[發明專利]一種社交網絡群體發現系統、方法及存儲介質在審
| 申請號: | 202010224848.8 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN112445939A | 公開(公告)日: | 2021-03-05 |
| 發明(設計)人: | 沈超;劉笑子;劉曉明;周亞東;管曉宏 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/951;G06Q50/00;G06K9/62;G06N3/04 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 李曉曉 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 網絡 群體 發現 系統 方法 存儲 介質 | ||
1.一種社交網絡群體發現方法,其特征在于,包括以下步驟:
步驟1、獲取在線社交網絡數據集,建立在線社交網絡拓撲圖;
步驟2、對在線社交網絡拓撲圖進行預處理,剔除孤立節點,得到預處理后的在線社交網絡拓撲圖;利用預處理后的在線社交網絡拓撲圖中各個節點對應的鄰接節點,建立在線社交網絡的鄰接矩陣;
步驟3、利用深度棧式自編碼器,對在線社交網絡的鄰接矩陣進行降維處理,得到降維矩陣;利用圖嵌入方法,將降維矩陣中的某一行向量作為社交網絡拓撲圖中對應節點的表示向量,得到節點嵌入向量;
步驟4、利用K-means方法對節點嵌入向量進行聚類,得到聚類結果,即為社交網絡群體發現結果。
2.根據權利要求1所述的一種社交網絡群體發現方法,其特征在于,還包括步驟5,具體為,利用NMI指數對社交網絡群體發現結果進行評估。
3.根據權利要求1所述的一種社交網絡群體發現方法,其特征在于,步驟1中,采用線上爬蟲或直接查找公開數據集方式獲取在線社交網絡數據集;其中,線上爬蟲時,利用社交平臺的應用程序接口,采用爬蟲框架爬取用戶信息、關注信息及轉發信息;
在線社交網絡拓撲圖的表達式如下:
G=(V,E)
其中,G為社交網絡拓撲圖,其節點個數為n;V為拓撲圖G中節點的集合;E為拓撲圖G中邊的集合。
4.根據權利要求1所述的一種社交網絡群體發現方法,其特征在于,步驟2中,當在線社交網絡拓撲圖G中的節點個數為n時,鄰接矩陣A的數學表達式為:
其中,若Ai,j=1,i∈[0,n-1],j∈[0,n-1],則社交網絡拓撲圖G中第i個節點與第j個節點為相鄰節點,若Ai,j=0,i∈[0,n-1],j∈[0,n-1],則社交網絡拓撲圖G中第i個節點與第j個節點為不相鄰節點。
5.根據權利要求1所述的一種社交網絡群體發現方法,其特征在于,步驟3中,對鄰接矩陣進行降維處理時,通過深度棧式自編碼器,進行學習鄰接矩陣,對鄰接矩陣中的每一行向量進行降維處理,得到降維矩陣;
具體包括以下步驟:
步驟31、利用深度棧式自編碼器,建立神經網絡模型;其中,深度棧式自編碼器包括若干棧式自編碼器,若干棧式自編碼器依次連接,且將前一個棧式自編碼器的輸出作為后一個棧式自編碼器的輸入;
步驟32、將鄰接矩陣帶入步驟31中的神經網絡模型中,進行神經網絡編碼計算,輸出壓縮模型;其中,神經網絡模型的編碼計算公式為:
a(l)=f(z(l))
z(l+1)=W(l,1)a(l)+b(l,1)
步驟33、將步驟32中的壓縮模型帶入神經網絡模型中,進行進行網絡解碼計算,輸出降維矩陣:其中,神經網絡模型的解碼計算公式為:
a(n+l)=f(z(n+l))
z(n+l+1)=W(n-l,2)a(n+l)+b(n-l,2)
其中,W(l,1)及W(n-l,2)分別為對應棧式自編碼器的權重;b(l,1)及b(n-l,2)是對應棧式自編碼器的偏置:al,a(n+l)均是棧式編碼器中的隱藏單元的激活值;zl,zl+1,zn+l+1是棧式自編碼器中的中間變量;
f(·;θ1)為特征提取函數,xi為鄰接矩陣A的第i行向量,i=1,2,…,n;f(xi;θ1)為編碼后的特征函數;g(·;θ2)為映射函數映射;l(·)為層級的損失函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010224848.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:腳手架部件及腳手架部件的連結結構
- 下一篇:光學檢測裝置





