[發明專利]線下移動社交網絡中挖掘種子用戶的方法和裝置在審
| 申請號: | 201910403964.3 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN110134877A | 公開(公告)日: | 2019-08-16 |
| 發明(設計)人: | 王曉飛;范昊;童旭;張晴;王晨陽 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/2458;G06F16/215 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 張宇園 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 移動社交網絡 網絡圖 方法和裝置 傳輸權重 獲取數據 聯通子圖 排序 量化 相似度計算 傳輸記錄 排序結果 挖掘 相似度 用戶維 移動 構建 清洗 發送 分解 輸出 | ||
1.一種線下移動社交網絡中挖掘種子用戶的方法,包括:
獲取數據;
對數據進行清洗并提取所需要的用戶維度信息;
根據所獲取數據中用戶之間的傳輸記錄構建移動社交網絡圖;
將所述移動社交網絡圖分解為若干個聯通子圖;
量化聯通子圖中用戶對之間發送次數的傳輸權重;
量化用戶對之間的位置相似度;
基于所述傳輸權重和位置相似度計算用戶的影響力并排序;
輸出排序結果,所得排序排名前設定個節點即作為種子用戶。
2.根據權利要求1所述的方法,其特征在于,所述獲取數據的方法包括網絡爬蟲或合作方式。
3.根據權利要求1所述的方法,其特征在于,所述移動社交網絡圖的構建方式包括:
將用戶表示為網絡圖中的節點,將用戶之間的傳輸關系表示為網絡圖中的有向邊,該有向邊的方向為發送者指向接收者,并將其傳輸的次數賦值為該有向邊的初始權重屬性,所述權重屬性公式為W(u,v):
其中,W為初始權重值;
u和v分別為發送者和接受者。
4.根據權利要求1所述的方法,其特征在于,所述分解為若干個聯通子圖,包括:
使用聚類算法并根據用戶之間的關系和分享行為把用戶劃分成不同的社交群組;
使在同一個群組內的用戶對之間至少發生過一次內容分享活動。
5.根據權利要求1所述的方法,其特征在于,量化聯通子圖中用戶對之間發送次數的傳輸權重的量化公式為:
其中S(u)為有文件分享活動的用戶集合;
u和v分別為發送者和接受者;
W(u,v)為初始權重值,表示用戶對之間傳輸的次數;
為傳輸權重值,表示用戶對之間發送次數的權重。
6.根據權利要求1所述的方法,其特征在于,量化用戶對之間的位置相似度的方法包括采用計算用戶對之間GPS的余弦相似度作為用戶對之間的位置相似度,其量化公式為:
其中,Lu,Lv分別表示用戶u與用戶v的GPS地理位置記錄;
Lul,Lvl分別為用戶u及用戶v經過設定GPS位置的概率;
Luv的取值范圍為0至1;
為用戶對之間位置相似度的權重值。
7.根據權利要求1所述的方法,其特征在于,所述計算用戶的影響力,包括:
求解移動社交網絡子圖中每個節點的得分;
分別比較只加入傳輸權重的用戶得分和只加入位置相似度的用戶得分。
8.根據權利要求1所述的方法,其特征在于,所述方法還包括采用隔跳朋友關系的方式選取種子用戶,包括:
選出最有影響力的用戶后,在選取第二個種子用戶的時候,排除該用戶的鄰居節點,選取其他節點中得分較高的用戶作為第二個種子用戶并重復該步驟繼續選取后面的種子用戶。
9.一種線下移動社交網絡中挖掘種子用戶的裝置,包括:
存儲器,用于存儲指令和數據,
處理器,配置為執行所述指令,以便:
獲取所述數據,對所述數據進行清洗并提取所需要的用戶維度信息;
根據所獲取數據中用戶之間的傳輸記錄構建移動社交網絡圖;
將所述移動社交網絡圖分解為若干個聯通子圖;
量化聯通子圖中用戶對之間發送次數的傳輸權重;
量化用戶對之間的位置相似度;
基于所述傳輸權重和位置相似度計算用戶的影響力并排序;
輸出排序結果,所得排序排名前設定個節點即作為種子用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910403964.3/1.html,轉載請聲明來源鉆瓜專利網。





