[發明專利]一種基于貝葉斯方法的多關系社交網絡模式挖掘方法在審
| 申請號: | 201710751229.2 | 申請日: | 2017-08-28 |
| 公開(公告)號: | CN107577742A | 公開(公告)日: | 2018-01-12 |
| 發明(設計)人: | 李建敦 | 申請(專利權)人: | 上海電機學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 上海申匯專利代理有限公司31001 | 代理人: | 翁若瑩,吳小麗 |
| 地址: | 201100 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 貝葉斯 方法 關系 社交 網絡 模式 挖掘 | ||
1.一種基于貝葉斯方法的多關系社交網絡模式挖掘方法,其特征在于,步驟為:
步驟1:基于n-cell模糊數進行不確定關系建模;通過n-cell模糊數將社交個體間的多種交互關系聚合,同時在不精確、不完整采樣環境下,盡可能保證到模糊子集的隸屬精度;
步驟2:基于貝葉斯方法進行模體識別;利用貝葉斯方法完成零模型的模擬生成,并完成子圖枚舉,通過理論分析來生成零模型及枚舉子圖;在概要拓撲不變的情況下,目標網絡中的多個特征均固定,因此以給定子圖、次數枚舉為輸入,通過概率函數來計算相應的發生概率。
2.如權利要求1所述的一種基于貝葉斯方法的多關系社交網絡模式挖掘方法,其特征在于:所述步驟1的具體過程為:首先抽取社交實體間的n種關系,n為正整數,作為連接初始特征,并用n-cell模糊數來建模;對于各屬性特征,面向“親密度高”模糊子集,通過采樣區間推測其域,根據先驗知識給出模糊隸屬度函數走勢,并構造一維三角模糊數,來計算給定屬性對到“親密度高”子集的隸屬度;最后,從n元隸屬度中選取最小值,并通過離散化方法實現到集合{強,弱}的映射;如此,就形成了含單調、離散權重的標簽社交網。
3.如權利要求1所述的一種基于貝葉斯方法的多關系社交網絡模式挖掘方法,其特征在于:所述步驟2的具體過程為:
步驟2.1:子圖分類
在網絡建模的基礎上,將連接的離散特征納入子圖同構指標,從而形成含權子圖;
步驟2.2:定義網絡同構指標
以含權網絡的無權拓撲,即概要拓撲,也就是無差別連接構成的概要網絡,作為網絡的基礎指標;
步驟2.3:子圖枚舉
將連接的單調離散特征融入拓撲結構中,建立新的子圖同構指標,即含標簽連接的子圖,并在目標網絡完成搜索與計數;
步驟2.4模體遴選
子圖是否是原網絡的構建模式,取決于其重要程度,此處通過三個指標衡量:
1)P值:識別子圖是否為原網絡的重要特征,即它在原網絡中的出現概率足夠低,要求PM≤P,P=[0.1,0.01];
2)U值:要求子圖在網絡中的出現次數達到足夠的量,如EM≥U,U=[2,4];
3)Z值:要求子圖在網絡中的出現次數在相應零模型子圖中占比足夠多方顯重要,即EM≥βEMB,β=[0.1,1]。
4.如權利要求2所述的一種基于貝葉斯方法的多關系社交網絡模式挖掘方法,其特征在于:所述步驟1中,社交實體間的關系包括關注度、引用、轉發、評論。
5.如權利要求2所述的一種基于貝葉斯方法的多關系社交網絡模式挖掘方法,其特征在于:所述步驟1的詳細過程如下:
分別針對n維實體關系O(A1,A2,...,An)中的Ai進行m次采樣,從而形成值域Di;Ai表示第i維實體關系,1≤i≤n,m、n為正整數;接下來分步計算模糊隸屬度:
步驟1.1:計算Di的算術平均值μi;
步驟1.2:計算Di的左分割度其中,N表示值域Di中小于μi的元素個數,dij表示第i維關系中的第j次采樣值,j為正整數;
步驟1.3:根據Di的值域[0,+∞)與到“親密度高”子集的語義邏輯,匹配三種不同的“雙邊”模型,即中間型、右邊型與左邊型;本發明所討論的節點關系與權重正相關,Di屬于右邊型,即當關系值超過給定閾值時,就視為完全隸屬于“親密度高”子集;
根據“右邊”模型,為各維關系構造三角模糊數即給定x=dij,其隸屬于“親密度高”子集的程度ui(x)可定義為:
其中α=[2,4];
步驟1.4:通過取最小值來集成各維關系,從而轉化為一維復合關系;
步驟1.5:通過閾值θ完成連續關系u到離散標簽的轉換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海電機學院,未經上海電機學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710751229.2/1.html,轉載請聲明來源鉆瓜專利網。





