[發明專利]一種社交群體發現方法、裝置和存儲介質有效
| 申請號: | 201910732451.7 | 申請日: | 2019-08-09 |
| 公開(公告)號: | CN110704612B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 井雅琪;李揚曦;劉權;段東圣;張皓彭;楊亞茹;沈華偉;佟玲玲;任博雅;胡燕林;段運強;時磊 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心;中國科學院計算技術研究所 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/31;G06F40/216;G06F40/30;G06Q50/00 |
| 代理公司: | 工業和信息化部電子專利中心 11010 | 代理人: | 張然 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 群體 發現 方法 裝置 存儲 介質 | ||
1.一種社交群體發現方法,其特征在于,包括:
利用預先設定的種子用戶和約束條件,從通信數據源中查找候選用戶,所述候選用戶包括與所述種子用戶通信的第一用戶和/或滿足所述約束條件的第二用戶;
從所述候選用戶的通信數據中提取與所述種子用戶關聯的關聯特征信息;
根據提取的關聯特征信息,確定每一候選用戶對應的置信度;
根據目標用戶之間的通信聯系建立初始群體網絡,所述目標用戶為置信度大于預設閾值的候選用戶;
利用群體發現算法從所述初始群體網絡中發現社交群體子網絡;
獲取所述社交群體子網絡中任兩個用戶在預設時間段內的短信通聯內容;
按照短信發送時間升序排列獲取的短信通聯內容;
計算相鄰兩條短信之間的時間間隔,得到時間間隔序列并按照升序排列;
按照切分百分比將所述時間間隔序列切分為兩段,所述切分百分比為利用標注有會話狀態的短信樣本數據進行訓練得到的;
標注第一段時間間隔對應的短信會話狀態為會話中;
針對每一社交群體子網絡,獲取根據該社交群體子網絡中包含的用戶之間發生通信聯系時的地理位置信息和通聯時間;
根據獲取的地理位置信息和用戶之間的通信數據,構建地理位置通聯網絡并顯示,所述地理位置通聯網絡中的網絡節點為地理位置信息,網絡的邊的權重為各個網絡節點用戶通聯次數之和;或者根據用戶之間發生通信聯系時的地理位置信息和通聯時間,獲得每個用戶隨時間變化的位置序列,每個位置序列構成一條位置軌跡;
顯示出現頻次高于第二預設頻次閾值的位置軌跡;
還包括:
針對每一社交群體子網絡,根據社交群體子網絡中網絡節點的度由大到小的順序選擇預設數量的用戶為關鍵用戶,確定選擇出的關鍵用戶對應的用戶類型為聯系人眾多的用戶;和/或,
根據社交群體子網絡中網絡節點的介數由大到小的順序選擇預設數量的用戶為關鍵用戶,確定選擇出的關鍵用戶對應的用戶類型為橋接用戶;和/或,
根據社交群體子網絡中網絡邊的權重由大到小的順序選擇預設數量的用戶為關鍵用戶,確定選擇出的關鍵用戶對應的用戶類型為交互頻繁用戶。
2.根據權利要求1所述的方法,其特征在于,利用群體發現算法從所述初始群體網絡中發現社交群體子網絡,具體包括:
從所述初始群體網絡中,查找大小為K的完全子圖,其中,K為大于1的整數;
以每個完全子圖為一個節點建立重疊矩陣;
將所述重疊矩陣轉換為鄰接矩陣;
確定所述鄰接矩陣的每個連通分量為一個社交群體子網絡。
3.根據權利要求1所述的方法,其特征在于,所述關聯特征信息包括以下至少一項:所述候選用戶與所述種子用戶之間的短信交互頻次、通話交互頻次、短信內容相關度、通聯時間和通聯人數;
根據提取的關聯特征信息,確定每一候選用戶對應的置信度,具體包括:
針對每一候選用戶,將該候選用戶對應的每一關聯特征信息進行歸一化處理得到關聯特征參數;
根據所述關聯特征參數確定該候選用戶對應的置信度。
4.根據權利要求1所述的方法,其特征在于,所述方法,還包括:
針對所述社交群體子網絡中的任一用戶,如果該用戶對應的用戶類型包括至少兩個,則根據該用戶在每一類型用戶中對應的排序序號,確定對應的排序序號最小的用戶類型為該用戶對應的用戶類型。
5.根據權利要求1所述的方法,其特征在于,所述方法,還包括:
針對每一社交群體子網絡,連接短信會話狀態為會話中的所有短信通聯內容得到短文本;
將所述短文本進行分詞并去除停用詞;
根據預設的主題數量,利用主題發現模型進行主題發現;
利用所述短文本中出現頻次大于第一預設頻次閾值的分詞繪制主題詞。
6.一種計算裝置,其特征在于,所述計算裝置包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執行時實現如權利要求1至5中任一項所述方法的步驟。
7.一種計算機存儲介質,所述計算機存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至5中任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心;中國科學院計算技術研究所,未經國家計算機網絡與信息安全管理中心;中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910732451.7/1.html,轉載請聲明來源鉆瓜專利網。





