[發明專利]基于局部最大對齊的后期融合多視圖聚類方法及系統在審
| 申請號: | 202111326425.8 | 申請日: | 2021-11-10 |
| 公開(公告)號: | CN114067395A | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 朱信忠;徐慧英;李苗苗;李洪波;殷建平;趙建民 | 申請(專利權)人: | 浙江師范大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/762;G06V10/80;G06K9/62;G06N20/00 |
| 代理公司: | 浙江千克知識產權代理有限公司 33246 | 代理人: | 趙芳 |
| 地址: | 321004 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 局部 最大 對齊 后期 融合 視圖 方法 系統 | ||
本發明公開了基于局部最大對齊的后期融合多視圖聚類方法及系統。其中涉及的基于局部最大對齊的后期融合多視圖聚類方法,包括步驟:S1.獲取聚類任務和目標數據樣本;S2.初始化各個視圖的置換矩陣、各個視圖的組合系數、對平均核進行核k均值聚類的平均劃分、各個視圖的鄰居矩陣;S3.計算各個視圖的基礎劃分,建立基于最大對齊的后期融合多視圖聚類目標函數;S4.獲取帶局部信息的基礎劃分,并結合各個視圖的鄰居矩陣和步驟S3,建立基于局部最大對齊的后期融合多視圖聚類目標函數;S5.采用循環方式求解建立的基于局部最大對齊的后期融合多視圖聚類目標函數,得到融合各個基礎劃分后的最優劃分;S6.對最優劃分進行k均值聚類,得到聚類結果。
技術領域
本發明涉及機器學習技術領域,尤其涉及基于局部最大對齊的后期融合多視圖聚類方法及系統。
背景技術
隨著多源信息采集技術的發展,所收集的數據可以有多種表示,例如,一段視頻可以有不同角度的影像數據和聲音數據。此類數據,在機器學習領域,被稱之為多視圖數據。對這類數據的充分合理的應用,一直是理論研究和科學實踐中的重要課題。聚類算法在機器學習中的無監督學習領域有重要地位,它旨在將無標簽的數據進行不相交的劃分。利用多視圖進行聚類,可以從不同角度提取樣本信息,從而要比單個視圖的聚類效果更好。
多視圖聚類可以大致分為以下三類:i)協同訓練多視圖聚類(A.Blum andT.Mitchell,“Combining labeled and unlabeled data with co-training,”in COLT1998,pp.92–100)。此類方法除了從各個視圖提取信息之外,同時尋求各個視圖的一致的聚類結果。ii)子空間聚類(X.Cao,C.Zhang,H.Fu,S.Liu,and H.Zhang,“Diversity-inducedmulti-view subspace clustering,”in CVPR 2015,pp.586–594.)。這種方法旨在通過不同視圖的表示,構建一個一致的子空間,達到視圖融合的目的。iii)多核聚類(M.andA.A.Margolin,“Localized data fusion for kernel kmeans clustering withapplication to cancer biology,”in NeurIPS 2014,pp.1305–1313.)。該算法的原理是,通過優化的方式尋找基核的最優組合系數,以達到提升聚類效果的目的。
上述方法中的多核聚類算法因為可解釋性強和效果好,而備受關注。然而在實際應用過程中,其存在以下兩個缺點:一是計算和存儲復雜度較高。因為要對若干個核矩陣進行存儲核計算,所以導致該類算法空間復雜度為O(n^2);還要對核矩陣進行特征分解,導致時間復雜度為O(n^3)。二是較為復雜的優化過程,增加了其陷入較差的局部最優的風險。
為了克服以上缺點,達到降低復雜度和簡化優化過程的目的。后期融合的多視圖聚類不再利用核矩陣進行融合,而是對更為輕量級的基礎劃分進行融合。基于最大對齊的后期融合多視圖聚類(S.Wang,X.Liu,E.Zhu,et al.,“Multi-view clustering via latefusion alignment maximization,”in IJCAI 2019,pp.3778–3784.),不但將計算復雜度從O(n^3)下降至O(n),還進一步提高了聚類效果。高效且有效的帶正則化項的缺失多視圖聚類算法(Liu X,Li M,Tang C,et al.,“Efficient and Effective RegularizedIncomplete Multi-view Clustering”,in TPAMI,2020,preprint)利用后期融合的方法處理缺失多視圖聚類問題,不但聚類效果超過同類型算法,且達到了較低計算復雜度。但是,這種方法并沒有考慮到數據的局部結構。目前,尚沒有方法能夠綜合后期融合較快的運算速度和數據局部結構等兩個優點。
發明內容
本發明的目的是針對現有技術的缺陷,提供了基于局部最大對齊的后期融合多視圖聚類方法及系統。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江師范大學,未經浙江師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111326425.8/2.html,轉載請聲明來源鉆瓜專利網。





