[發明專利]基于word2Vec的社團構建方法、裝置及計算機處理設備在審
| 申請號: | 201710515571.2 | 申請日: | 2017-06-29 |
| 公開(公告)號: | CN107392782A | 公開(公告)日: | 2017-11-24 |
| 發明(設計)人: | 彭恩偉 | 申請(專利權)人: | 上海斐訊數據通信技術有限公司 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00;G06F17/30 |
| 代理公司: | 上海碩力知識產權代理事務所(普通合伙)31251 | 代理人: | 郭桂峰 |
| 地址: | 201616 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 word2vec 社團 構建 方法 裝置 計算機 處理 設備 | ||
1.一種基于word2Vec的社團構建方法,其特征在于,包括:
統計社交網絡中的所有用戶節點,及不同用戶節點之間的社交關聯關系;
以所述社交網絡的任一用戶節點為起點,根據不同用戶節點間的社交關聯關系,以設定的跳數進行隨機游走,得到由用戶節點組成的多個第一節點序列;
設置一指定長度的滑動窗口,對每一所述第一節點序列進行截取操作,得到長度等于指定長度的多個第二節點序列;
將所述第二節點序列輸入到word2Vec模型進行訓練,得到所述社交網絡中每一用戶節點的矩陣表示;
根據用戶節點矩陣,計算每兩個用戶節點之間的相似度,以對用戶節點劃分社團。
2.根據權利要求1所述的基于word2Vec的社團構建方法,其特征在于,在以設定的跳數進行隨機游走的步驟中,包括步驟:
設定每個用戶節點發放的隨機游走個數;其中,所述隨機游走個數與同所述用戶節點具有社交關聯關系的用戶節點數量相關;
設定任一用戶節點發放的隨機游走的跳數;
按照設定的隨機游走個數及隨機游走的跳數,從任一用戶節點開始,根據用戶節點之間的社交關聯關系,得到所述第一節點序列。
3.根據權利要求2所述的基于word2Vec的社團構建方法,其特征在于,在根據用戶節點矩陣,計算每兩個用戶節點之間的相似度,以對用戶節點劃分社團的步驟中,包括步驟:
設定用戶節點的矩陣表示的矩陣距離的閾值;
分別計算每兩個用戶節點的矩陣件的矩陣距離;
對比計算結果與設定的閾值,當所述計算結果小于設定閾值時,將對應的節點劃分到同一社團。
4.根據權利要求3所述的基于word2Vec的社團構建方法,其特征在于,劃分到同一社團內的用戶節點,兩兩之間的矩陣距離的計算結果均小于設定的閾值。
5.根據權利要求1所述的基于word2Vec的社團構建方法,其特征在于,在設置一指定長度的滑動窗口時,所述滑動窗口的長度為大于等于2、小于等于設定的跳數的實數。
6.根據權利要求5所述的基于word2Vec的社團構建方法,其特征在于,在將所述第二節點序列輸入到word2Vec模型進行訓練的步驟中,是將按照不同長度的滑動窗口截取得到的所有第二節點序列輸入到word2Vec模型進行訓練,得到每一用戶節點的矩陣表示。
7.根據權利要求6所述的基于word2Vec的社團構建方法,其特征在于,所述用戶節點的矩陣表示為一1*n的矩陣。
8.根據權利要求7所述的基于word2Vec的社團構建方法,其特征在于,設定統計得到的全部用戶節點個數為N,則所述矩陣的列數等于N-1。
9.一種計算機處理設備,包括處理器及計算機可讀存儲介質,其特征在于,所述處理器獲取所述計算機可讀存儲介質上的計算機程序,并執行如權利要求1-8任一所述方法的步驟。
10.一種基于word2Vec的社團構建裝置,其特征在于,包括:
統計模塊,用于執行統計社交網絡中的所有用戶節點,及不同用戶節點之間的社交關聯關系的步驟;
第一節點序列生成模塊,用于執行以所述社交網絡的任一用戶節點為起點,根據不同用戶節點間的社交關聯關系,以設定的跳數進行隨機游走,得到由用戶節點組成的多個第一節點序列的步驟;
第二節點序列生成模塊,用于執行設置一指定長度的滑動窗口,對每一所述第一節點序列進行截取操作,得到長度等于指定長度的多個第二節點序列的步驟;
訓練模塊,用于執行將所述第二節點序列輸入到word2Vec模型進行訓練,得到所述社交網絡中每一用戶節點的矩陣表示的步驟;
社團劃分模塊,用于執行根據用戶節點矩陣,計算每兩個用戶節點之間的相似度,以對用戶節點劃分社團的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海斐訊數據通信技術有限公司,未經上海斐訊數據通信技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710515571.2/1.html,轉載請聲明來源鉆瓜專利網。





