[發明專利]一種社交網絡分析方法和裝置有效
| 申請號: | 201110391293.7 | 申請日: | 2011-11-30 |
| 公開(公告)號: | CN103138981B | 公開(公告)日: | 2017-03-29 |
| 發明(設計)人: | 鄧超;高丹;江志雄;徐萌;羅治國;錢嶺;孫少陵 | 申請(專利權)人: | 中國移動通信集團公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24 |
| 代理公司: | 北京中譽威圣知識產權代理有限公司11279 | 代理人: | 郭振興,張杏珍 |
| 地址: | 100032 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 網絡分析 方法 裝置 | ||
技術領域
本發明涉及一種業務支撐技術,尤其涉及一種社交網絡分析方法和裝置。
背景技術
社交網絡(social?network)是指社會個體成員之間因為互動而形成的相對穩定的關系體系,社交網絡關注的是人們之間的互動和聯系,社會互動會影響人們的社會行為。
社交網絡分析(social?network?analysis)是從社交網絡角度出發,對大規模數據進行全面的,多維度的分析。社交網絡可看作是由圖表示的異構多關系數據集,圖中節點表示對象,邊表示對象間聯系或相互作用的鏈接
過去的幾十年間,社交網絡受到越來越多的關注。特別是移動電信網絡和互聯網的發展,產生了大量的,容易被計算機處理的社交網絡數據。從這些海量數據中獲取知識,從而理解商業行為,識別業務模式,分析用戶行為,更好利用資源,提高服務質量,將成為運營商的核心競爭力之一。
電信社群網絡是一種以用戶為節點、用戶之間的通話為邊構造的網絡,該網絡既體現了電信用戶之間的通信關聯關系,又在一定程度上體現了社會中人與人之間的社交關系。利用通話數據的多維屬性,如通話時間、通話時長、頻率等,從多個視角對人們日常的通話行為進行了刻畫,從而深刻揭示了人們交往行為的模式和內在特征。
相對于傳統的基于屬性向量的分析,社交網絡分析(social?network?analysis)通過考慮對象間連接關系,可以獲得如下新知識:根據對象的屬性和連接,以及連接到它的對象的屬性預測對象的類型;根據所涉及的對象的性質,預測二者間交往鏈接的類型或目的;預測對象間是否存在交往鏈接;根據對象的屬性和鏈接,預測兩個對象是否事實上相同;根據對象屬性和鏈接結構,預測對象是否處于一個組或簇。
目前,對電信通信網絡和互聯網這樣大規模的社交網絡進行分析,是一個比較困難的問題。
一方面,電信領域的用戶通話記錄通常是以數據庫表的方式存儲,而傳統的關系數據庫和數據倉庫沒有專門的網絡/圖數據生成和計算能力。因此,在數據倉庫上進行社交網絡分析,首先需要采用SQL編程的方式生成網絡數據,再進行計算,導致社交網絡分析的能力非常有限。
目前,中國移動經營分析系統用于用戶行為分析的客戶流失預測中使用到社會交往圈信息,采用的技術方案是用類似“Select主叫號碼,被叫號碼,sum(時長)from詳單表where條件Groupby主叫號碼”的SQL語句,從數據倉庫中查詢得到客戶間主叫與被叫、時長的記錄表,代表網絡上節點、節點間連接、權重信息。然后將這些信息用于客戶流失預測應用中。
以一個擁有3000萬用戶的中等規模省公司為例,平均每個用戶每月有100條通話記錄,則每月的話單記錄數為3000萬*60%*100條/月=18億條/月,目前即使只處理一個月的18億條話單數據生成交往圈記錄表,就需要2天的時間。實際分析應用中,為保證分析效果,通常需要3~6個月的詳單進行分析,因此現有方案無法適應從大規模數據生成社交網絡。另外,現有技術方案也僅對具有直接通過交往行為的用戶之間生成了邊表格式的單層網絡拓撲結構,而對用戶之間的間接交往行為基本無法分析,即無法得到網絡整體拓撲特征值。
另一方面,針對大規模數據,即使生成了社交網絡,傳統的社交網絡分析軟件也往往是單機應用,很難擴展以支持電信級和互聯網級大規模海量數據的分析。
社交網絡中網絡整體拓撲特征的分析,即圖上各節點和邊的各種特征值的計算,是各種社交網絡分析應用的基礎,也是決定社交網絡分析系統效率的關鍵計算環節。這些特征值的計算,經常需要對整個網絡上所有節點和邊遍歷求解,這也是制約現有社交網絡分析系統無法適應大規模海量數據分析的關鍵因素。比如,社交網絡中所有節點和邊的pagerank值、單源和多源最短路徑值求解,都需要對整個圖進行遍歷。如果是大規模網絡,則基于單機的分析軟件,可能會出現內存無法承受的情況;或者由于各特征值的求解方法通常是n3時間復雜度,導致系統無法響應大規模網絡特征計算任務。
現有技術的主要缺點包括:
1、現有基于數據倉庫/數據庫的社交網絡生成和分析應用,無法處理由大規模數據生成社交網絡的任務,且網絡分析只能針對網絡的單層拓撲結構特征進行分析,對網絡整體拓撲結構特征的分析基本無能為力。
2、現有社交網絡分析軟件是基于單機的應用,無法適應電信級和互聯網級海量數據形成的大規模社交網絡的分析任務,尤其是對網絡整體拓撲特征值分析時,需要對全部節點和邊在整個網絡上遍歷求解的情形,成為制約系統效率和處理能力的瓶頸。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團公司,未經中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110391293.7/2.html,轉載請聲明來源鉆瓜專利網。





