[發明專利]基于成對協同正則化和NMF的自適應多視圖聚類方法有效
| 申請號: | 201710466702.2 | 申請日: | 2017-06-20 |
| 公開(公告)號: | CN107292341B | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 王秀美;張天真;高新波;王鑫鑫;李潔;鄧成;田春娜 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 61205 陜西電子工業專利中心 | 代理人: | 韋全生;王品華 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 成對 協同 正則 nmf 自適應 視圖 方法 | ||
本發明提出了一種基于成對協同正則化和NMF的自適應多視圖聚類方法,用于解決現有多視圖聚類方法中存在的精度低和歸一化交互信息低的技術問題,實現步驟為:獲取原始圖像集的歸一化非負多視圖數據;計算多視圖數據的拉普拉斯矩陣;構建成對協同正則化和NMF的自適應多視圖聚類的目標函數;分別獲取基矩陣、系數矩陣和權重參數的迭代更新表達式;獲取更新后的基矩陣、系數矩陣和權重參數;對更新后的系數矩陣進行K?均值聚類,得到聚類結果。本發明利用成對協同正則化方法保持視圖間的相似性,并利用自適應方法自動學習視圖內的相似性約束項的權重參數,有效提高了多視圖聚類的性能,可應用于客戶信息分析、金融分析和醫學等領域。
技術領域
本發明屬于計算機視覺和模式識別技術領域,涉及一種自適應多視圖聚類方法,具體涉及一種基于成對協同正則化和NMF的自適應多視圖聚類方法,可應用于客戶信息分析、金融分析和醫學等領域。
背景技術
隨著互聯網、信息采集和信息檢索等技術的高速發展,數據量急劇增多,信息社會已進入大數據時代。因此,如何從海量的數據中提取能夠為我們所用的信息成為現代科學的當務之急。由此,數據挖掘應運而生,成為一種數據信息處理技術。聚類是數據挖掘領域中進行數據處理的重要分析工具和方法,同時也是機器學習領域中重要的研究方向。如今,單視圖的數據聚類已取得較好的效果,然而,現階段實際應用中的數據一般通過多特征或多視圖進行描述,并且每個特征往往包含互補和交互信息。因此,如何利用多特征或多視圖所包含的信息提高聚類性能,成為現階段聚類的關鍵問題。針對多視圖數據,如何設計快速有效的聚類算法,成為大數據時代亟待解決的問題。
聚類是將物理或抽象對象的集合分成由類似的對象組成的多個簇的過程。聚類算法以相似性為基礎,由聚類所生成的簇是一組數據對象的集合,同一簇中的對象彼此相似,不同簇間的對象相異。聚類算法是為單視圖數據設計的方法,經典的單視圖聚類算法可分為基于劃分、基于層次、基于密度、基于網格和基于統計學等聚類算法。多視圖聚類的關鍵是如何融合多視圖數據。多視圖聚類一種樸素的做法是將不同視圖的數據拼接成一個新的向量,然后基于拼接的向量,采用經典的單視圖學習算法進行聚類。但這種方法只是原則上連接了不同視圖的數據,而忽略了不同視圖中的共享信息和特定的統計性質。另一種廣泛使用的多視圖聚類方法是對不同視圖的數據進行融合,然后再進行聚類,得到聚類結果。這種方法可以充分挖掘不同視圖的數據中包含的兼容和互補信息,因此可以得到較好的聚類結果。
NMF(Nonnegative Matrix Factorization,非負矩陣分解)將數據矩陣分解成兩個低秩因子矩陣,實現了數據的低秩表示,并且分解后得到的基矩陣和系數矩陣具有較好的可解釋性、明確的物理意義、占用存儲空間少等優點,因此,NMF成為數據聚類的基本工具,廣泛應用于單視圖數據聚類和多視圖數據聚類中。
例如Deng Cai,Xiaofei He和Jiawei Han等人,在2011年的IEEE TransactionsPattern Analysis and Machine Intelligence期刊的第8期,發表了名為“GraphRegularized Nonnegative Matrix Factorization for Data Representation”的文章,提出了基于圖正則化NMF的數據表示方法,將圖正則化合并到NMF的算法框架中,利用NMF對數據進行分解,得到對應的基矩陣和系數矩陣,并對分解得到的系數矩陣進行圖正則化約束,保持數據的局部幾何結構信息,取得了較好的聚類效果。該方法是為單視圖數據設計的,將該方法應用到多視圖聚類時,對每個視圖的數據進行NMF,并對每個視圖得到的系數矩陣分別進行圖正則化,保持每個視圖的相似性,但這種推廣只考慮了視圖內的相似性,忽略了視圖間的相似性,并且為圖正則化約束項設置了相同的權重參數,因此,使得多視圖聚類的精度低和歸一化交互信息低,影響了聚類性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710466702.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于卷積神經網絡的側線鱗識別方法
- 下一篇:數據處理方法及相關產品





