[發明專利]一種非負矩陣社區發現方法及電影社區發現方法有效
| 申請號: | 202010134409.8 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111400652B | 公開(公告)日: | 2023-06-13 |
| 發明(設計)人: | 徐慧;趙瑩瑩;曹金鑫;鞠小林;周成 | 申請(專利權)人: | 南通大學 |
| 主分類號: | G06F17/16 | 分類號: | G06F17/16;G06Q50/00 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 朱小兵 |
| 地址: | 226019*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 矩陣 社區 發現 方法 電影 | ||
本發明提供了一種非負矩陣社區發現方法及電影社區發現方法,包括如下步驟S11數據收集與計算,形成相似度矩陣X和L;S12將X進行非負矩陣分解,X≈UV;S13構造含有L的目標函數O;以及S14基于目標函數,得到非負矩陣分解的迭代公式,進行迭代,完成社區劃分。本發明的一種非負矩陣社區發現方法及電影社區發現方法,將雙屬性的非負矩陣分解應用于社區發現,提高了社區分解模塊的精確性。
技術領域
本發明涉及數據挖掘技術領域,具體涉及一種非負矩陣社區發現方法及電影社區發現方法。
背景技術
社交網絡作為信息傳遞的主要載具,其涵蓋的信息量對于當今社會具有重要的研究意義,從個體到群體,從小世界到大社會,現實生活中總存在隱含的聯系將人們鏈接起來。很多實際網絡中的節點具有聚集化特性——“社區結構”。網絡中社區發現的研究已經取得很多研究成果,可以大體將社區發現方法分為圖切割方法、目標函數優化方法、聚類方法和啟發式方法等。社區發現常用于分析社會群體之間的結構特征。隨著信息化技術的發展,信息系統中保存著大量用戶的信息特征,用戶與用戶之間也存在著某種關聯性。用戶的特征具有多維度,且多關聯性。社區發現能幫助人們更有效地了解網絡的結構特征,從而提供更有效、更具個性化的服務。
非負矩陣分解(nonnegative?matrix?factorization,NMF)機器學習中的一種特征提取和降維的方法,近年來被用于社區發現。NMF是指將一個高維(m╳n)的非負矩陣X分解為兩個低維的非負矩陣U(m╳k)和V(k╳n),使X≈UV。非負矩陣分解在提取高維數據中隱含模式和結構方面具有良好性能,對于非負矩陣分解的改進,多在分解方法上,如正交非負矩陣分解法、凸非負矩陣的對應分解方法、投影非負矩陣的對應分解方法。利用NFM的性能,基于NMF的社區發現,成為研究內容。例:基于鄰接矩陣方法、基本物理過程方法、基于節點共有鄰居方法、基于最短路徑方法等。
發明內容
為了解決上述問題,本發明提供一種非負矩陣社區發現方法及電影社區發現方法,將雙屬性的非負矩陣分解應用于社區發現,提高了社區分解模塊的精確性。
為了實現以上目的,本發明采取的一種技術方案是:
一種非負矩陣社區發現方法,包括如下步驟:S11數據收集與計算,形成相似度矩陣X和L;S12將X進行非負矩陣分解,X≈UV;S13構造含有L的目標函數O;以及S14基于目標函數,得到非負矩陣分解的迭代公式,進行迭代,完成社區劃分。
進一步地,所述步驟S11用鄰接表表示實體集及其第一組屬性;用第一距離計算方法,計算基于這組屬性的實體間的距離,形成相似度矩陣X;用所述實體集的第二組屬性,用第二距離計算方法,形成相似度矩陣L。
進一步地,所述第一組屬性與所述第二組屬性有交集。
進一步地,所述第一距離計算方法與所述第二距離計算方法相同。
進一步地,所述步驟S13含有L的目標函數
O=||X-UVT||2+λTr(VTLV)
其中,U和V的矩陣大小分別為m╳k以及k╳n;λ是平滑度,λ值在(0,1]區間;Tr(VTLV)是矩陣的跡;k社區數,初值kmin(m,n),在迭代過程中對沒有意義的分量進行移除,對k進行不斷的修正,最終由結果定。
進一步地,所述步驟S14非負矩陣分解的迭代公式
每迭代一次,計算目標函數O,當O不再變化時,迭代結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學,未經南通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010134409.8/2.html,轉載請聲明來源鉆瓜專利網。





