[發明專利]基于非負矩陣分解和劃分自適應融合的多視角聚類方法有效
| 申請號: | 201911332635.0 | 申請日: | 2019-12-22 |
| 公開(公告)號: | CN111191699B | 公開(公告)日: | 2022-10-21 |
| 發明(設計)人: | 陶性留;俞璐;王曉瑩;姚艷艷 | 申請(專利權)人: | 中國人民解放軍陸軍工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/26 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 王瑋 |
| 地址: | 210007 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 矩陣 分解 劃分 自適應 融合 視角 方法 | ||
本發明公開了一種基于非負矩陣分解和劃分自適應融合的多視角聚類方法。針對多視角聚類任務如何更好地實現視圖間的學習,提出一種新的視角融合策略,該策略首先為每個視角設置一個劃分,然后通過自適應學習獲取一個融合權重矩陣對每個視角的劃分進行自適應融合,最終利用視角集成方法得到全局劃分結果。將上述策略應用于經典的FCM模糊聚類框架中,采用交替方向乘法器優化模型(Alternating Direction Method of Multipliers,ADMM)求解。與幾種相關聚類算法相比,本發明的方法在處理多視角聚類任務時具有更好的適應性和聚類。
技術領域
本發明涉及數據挖掘和模式識別技術領域和數據分析與人工智能領域,具體是一種基于非負矩陣分解和劃分自適應融合的多視角聚類方法。
背景技術
近年來,互聯網信息技術在現實生活中得到了迅速發展和廣泛應用,使信息和數據呈現爆炸式增長。在描述一些實際問題的過程中,同樣的事情可以用不同的方式,從不同的角度或不同的形式來描述。各種描述稱為事物的多個視圖,數據稱為多視圖數據[1]。每個單獨的視圖都足以挖掘知識,從多個視圖中組合有價值的信息可以提高性能和質量。然而,主要的挑戰是如何集成這些多個表示或視圖提供的獨立兼容和互補的信息,并為諸如集群和分類等任務提供所有視圖之間的參考解決方案。
多視圖聚類的目標是根據對象的多個表示形式將對象劃分為多個集群。聚類算法的基本思想是將一組數據對象按照一定的準則進行分組,將相似的對象分組到同一個集群中,將不同的對象分組到不同的集群中。多視角聚類算法己被證實優于單視圖聚類算法,且具有更好的穩定性,更低的時間復雜度。在1998年,由Bulum和Mitchell提出的Co-training開啟了多視角學習的先河。隨后,多視角聚類算法如雨后春筍般大量出現,根據其內容的不同,可大致地分成四類:Co-training,多核學習,子空間學習和多視角圖學習。Co-training這類方法使用協同訓練策略來處理多視角數據,著力于最大化兩個不同的視圖間的一致性。它通過使用已有的或相互學習的知識來引導不同視圖的聚類。通過迭代執行該策略,所有視圖的聚類結果趨于彼此,這將導致所有視圖之間達成最廣泛的共識。多核學習方法使用是將不同視圖對應的預定義內核,然后線性或非線性地組合這些內核,以提高聚類性能。子空間學習通過假設所有視圖共享一個表示,從所有視圖的所有特性子空間中學習統一的特性表示,輸入到用于聚類的模型中。多視角圖學習即尋找一個跨所有視圖的融合圖(或網絡),然后在融合圖上使用圖割算法或其他技術(如譜聚類)來產生聚類結果。2012年,Tzortzis等人針對不同的視角,通過核函數進行相應加權聚類,發現不同視角在更加合適的權重下可以得到更高的精度。2009年,Chaudhur等人通過典型相關分析提取兩個視角的共享信息將其作為本質特征進行聚類,從而提出了一種基于典型相關分析的多視角聚類算法。2016年,Zhang等人通過利用各視角中樣本與樣本的關聯程度去學習的幾何圖結構,提出了一種基于超圖正則化非負矩陣分解的多視角聚類算法。
人們獲得的數據普遍具有如下兩個特點:(1)數據量龐大,檢索困難;(2)數據維數巨大,處理困難。雖然高維數據也許含有更多的信息,但將其直接用于分類、聚類或概率密度估計等任務,必將付出巨大的時間和空間代價。因此降維特征提取過程已經成為許多數據挖掘問題的一種預處理手段。數據降維的本質是尋找一個低維表示來反映原始數據的內在特征,并使后續任務在這個低維表示上的工作量更低,同時泛化性能和識別率更高。通過利用非負矩陣分解獨特的優勢,不僅可以進行降維,而且物理意義明確。
因此,需要對這些龐大的原始矩陣進行分解,達到數據壓縮、降維、降噪的目的。但也有可能破壞數據樣本之間的本質結構,影響聚類效果。此外,傳統的聚類算法認為,只需要將這些不同屬性下的樣本組合成一個整體進行處理,因為多角度的樣本是同一對象不同屬性的組合形式。但是,這種方法可能會破壞原始對象在不同屬性下的獨立性,導致得到的全局聚類結果并不理想。
發明內容
本發明的目的在于提出一種基于非負矩陣因子分解和分割自適應融合的多視圖模糊聚類算法,該算法具有較好的自適應性和聚類效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍陸軍工程大學,未經中國人民解放軍陸軍工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911332635.0/2.html,轉載請聲明來源鉆瓜專利網。





