[發明專利]一種基于SNS的社交網絡數據挖掘方法及系統、服務設備在審
| 申請號: | 202010542081.3 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN111782963A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 周靜 | 申請(專利權)人: | 中國鐵塔股份有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06Q50/00 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;黃燦 |
| 地址: | 100142 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 sns 社交 網絡 數據 挖掘 方法 系統 服務 設備 | ||
1.一種基于SNS的社交網絡數據挖掘方法,其特征在于,包括:
基于SNS中任意兩個用戶之間的互動關系,構建出社交網絡的數據模型;
基于所述數據模型,執行社交網絡數據挖掘操作;
其中,所述社交網絡數據挖掘操作包括但不限于社交網絡可視化展現、熱點人物發現、好友互動指數度量、基于好友互動指數的社群發現、好友推薦以及個性化信息推薦。
2.根據權利要求1所述的社交網絡數據挖掘方法,其特征在于,所述SNS中每一個用戶對應一個節點,用戶i向用戶j主動發出一次線上互動時,會對應一條用戶i對應的節點i指向用戶j對應的節點j的邊,所述邊的權重W(i,j)至少與互動類型、互動頻率以及互動時效三個因素有關,所述邊的權重W(i,j)代表了用戶i與用戶j兩個用戶之間的社交親密程度。
3.根據權利要求2所述的社交網絡數據挖掘方法,其特征在于,所述基于SNS中任意兩個用戶之間的互動關系,構建出社交網絡的數據模型,包括:
定義SNS網絡中用戶i主動向用戶j發出不同互動類型對應的權重V(i,j)如下:
V(i,j)∈[1,2,3,4,5]
其中,所述V(i,j)取值為1-5之間的整數,所述V(i,j)取值越大表示所述用戶i和用戶j之間的社交親密程度越高;
定義互動時效的因子TF(t)如下:
其中,t:表示第k次互動的發生月份;T1表示本月;T0表示時間起始月份;分子、分母各加1是為了防止分子或分母等于0的情況出現;互動時間越晚的互動時效性越強,互動時效的因子TF(t)越大;
定義用戶i主動向用戶j發起第k次互動的權重wk(i,j,t)如下:
wk(i,j,t)=V(i,j)×TF(t)
定義用戶i主動向用戶j發起所有互動的總權重W(i,j)如下:
K:表示用戶i主動向用戶j發起共K次互動,即互動頻率;其中,K≥k。
基于SNS中的用戶i主動向用戶j發起的所有互動的總權重W(i,j),構建出一個帶權重的有向的社交網絡圖,作為社交網絡的數據模型。
4.根據權利要求3所述的社交網絡數據挖掘方法,其特征在于,若所述社交網絡數據挖掘操作包括社交網絡可視化展現,則所述基于所述數據模型,執行社交網絡數據挖掘操作,包括:
以邊的長度或粗細或顏色不同來表示所述數據模型中的邊的權重不同;其中,所述邊的長度越短,表示所述邊的權重越大;所述邊的越粗,表示所述邊的權重越大;所述邊的顏色越深,表示所述邊的權重越大;
以及,以節點的大小或顏色不同來表示用戶的活躍或受歡迎程度;其中,節點越大表示表示用戶的越活躍或越受歡迎;所述節點的顏色越深表示用戶的越活躍或越受歡迎。
5.根據權利要求4所述的社交網絡數據挖掘方法,其特征在于,若所述社交網絡數據挖掘操作還包括熱點人物發現,所述方法還包括:
根據每個節點的入度、出度,挖掘SNS網絡中的熱點人物;
其中,節點i的入度Indegree(i):定義為所有指向節點i的邊的權重之和;
其中,節點i的出度Outdegree(i):定義為所有從節點i發出的邊的權重之和;
其中,節點i的出度Outdegree(i)出越高,表示所述節點i對應的用戶i在社交關系中越積極主動;節點i的入度Indegree(i)越高,表示所述節點i對應的用戶i的受歡迎程度越高;SNS網絡中入度Indegree(i)最高的前幾名用戶作為SNS網絡中的熱點人物。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國鐵塔股份有限公司,未經中國鐵塔股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010542081.3/1.html,轉載請聲明來源鉆瓜專利網。





