[發明專利]一種基于貝葉斯方法的多關系社交網絡模式挖掘方法在審
| 申請號: | 201710751229.2 | 申請日: | 2017-08-28 |
| 公開(公告)號: | CN107577742A | 公開(公告)日: | 2018-01-12 |
| 發明(設計)人: | 李建敦 | 申請(專利權)人: | 上海電機學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 上海申匯專利代理有限公司31001 | 代理人: | 翁若瑩,吳小麗 |
| 地址: | 201100 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 貝葉斯 方法 關系 社交 網絡 模式 挖掘 | ||
技術領域
本發明涉及一種基于貝葉斯方法的多關系社交網絡模式挖掘方法,面向多關系社交網絡,旨在通過網絡含權模體的識別來挖掘其中的交互模式,從而為分析社團中觀結構、明確社團性質及社團細分提供更精準的支持,屬于網絡含權模體挖掘技術領域。
背景技術
針對多關系社交網絡,現有的模體挖掘技術主要建立在簡單網絡,即無權模型基礎上。
傳統的多關系建模往往采用加權平均法,而此舉是建立在信息完備的理想預設下的?,F實中,由于數據集規模與采集技術的不完善,加權平均法無法全面地將多元連續的不確定性關系有效特征化。
傳統的模體識別需要借助零模型來完成,即在保持微觀尺度網絡特征(如節點度)的前提下,面向原網絡進行隨機化,并在原網絡與隨機網絡間同時進行子圖枚舉,并通過相互比較完成模體遴選。這種實地置亂重連的馬爾可夫過程,會導致算法的收斂過程較慢。
對于模體挖掘算法本身來說,現有技術一般只關注子圖的拓撲結構,而忽略了連接之間的差異,比如連接強度或權重,致使目標挖掘模式并不精確。
綜上,現有的模體挖掘技術忽略了實體間連接的多樣性與不確定性,對網絡的刻畫較為粗糙,致使對網絡中觀模式的挖掘不夠精準,從而造成對宏觀現象解釋不利的現象。
發明內容
本發明要解決的技術問題是:針對現有的一般性模體識別方法在單一性與不確定性方面的不足,提供一種能夠對真實的社交網絡進行較普適地刻畫,特別是對多關系、不確定關系能提供高精度、高可靠性的描述并挖掘的方法。
為了解決上述技術問題,本發明的技術方案是提供一種基于貝葉斯方法的多關系社交網絡模式挖掘方法,其特征在于,步驟為:
步驟1:基于n-cell模糊數進行不確定關系建模;通過n-cell模糊數將社交個體間的多種交互關系聚合,同時在不精確、不完整采樣環境下,盡可能保證到模糊子集的隸屬精度;
步驟2:基于貝葉斯方法進行模體識別;利用貝葉斯方法完成零模型的模擬生成,并完成子圖枚舉,通過理論分析來生成零模型及枚舉子圖;在概要拓撲不變的情況下,目標網絡中的多個特征均固定,因此以給定子圖、枚舉次數為輸入,通過概率函數來計算相應的發生概率。
優選地,所述步驟1的具體過程為:首先抽取社交實體間的n種關系,n為正整數,作為連接初始特征,并用n-cell模糊數來建模;對于各屬性特征,面向“親密度高”模糊子集,通過采樣區間推測其域,根據先驗知識給出模糊隸屬度函數走勢,并構造一維三角模糊數,來計算給定屬性對到“親密度高”子集的隸屬度;最后,從n元隸屬度中選取最小值,并通過離散化方法實現到集合{強,弱}的映射;如此,就形成了含單調、離散權重的標簽社交網;
優選地,所述步驟2的具體過程為:
步驟2.1:子圖分類
在網絡建模的基礎上,將連接的離散特征納入子圖同構指標,從而形成含權子圖;此舉能夠保證在最終的結果模式中,依然保留有連接的偏序關系;
步驟2.2:定義網絡同構指標
為了突顯網絡中觀結構的重要性,需要給出網絡同構的基礎指標;此處,為了有效避免零模型的實地生成,以含權網絡的無權拓撲,即概要拓撲,也就是無差別連接構成的概要網絡,作為網絡的基礎指標;
步驟2.3:子圖枚舉
將連接的單調離散特征融入拓撲結構中,建立新的子圖同構指標,即含標簽連接的子圖,并在目標網絡完成搜索與計數。
步驟2.4:模體遴選
子圖是否是原網絡的構建模式,取決于其重要程度,此處通過三個指標衡量:
1)P值:識別子圖是否為原網絡的重要特征,即它在原網絡中的出現概率足夠低,要求PM≤P,P=[0.1,0.01];
2)U值:要求子圖在網絡中的出現次數達到足夠的量,如EM≥U,U=[2,4];
3)Z值:要求子圖在網絡中的出現次數在相應零模型子圖中占比足夠多方顯重要,即EM≥βEMB,β=[0.1,1]。
更優選地,所述步驟1中,社交實體間的關系包括關注度、引用@、轉發、評論。
更優選地,所述步驟1的詳細過程如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海電機學院,未經上海電機學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710751229.2/2.html,轉載請聲明來源鉆瓜專利網。





