[發明專利]基于自適應鄰近點的多視角聚類方法在審
| 申請號: | 201811559259.4 | 申請日: | 2018-12-21 |
| 公開(公告)號: | CN109784374A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 聶飛平;蔡國豪;王榕;于為中;李學龍 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 常威威 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 鄰接 多視角 求解 函數模型 鄰近點 自適應 構建 權重 樣本 預處理 數據預處理 視角 聚類結果 特征矩陣 初始化 魯棒性 無監督 秩約束 自學習 迭代 連通 引入 學習 | ||
本發明提供了一種基于自適應鄰近點的多視角聚類方法。首先,計算待聚類樣本不同視角下的特征矩陣,并進行數據預處理,利用預處理后的數據和初始化權重求解所構建的帶秩約束的函數模型,得到初始鄰接圖;然后,構建基于自學習權重的多視角聚類函數模型,并進行迭代求解,得到最優鄰接圖;最后,求解得到最優鄰接圖的連通分量,即最終的聚類結果。本發明方法可以利用待處理樣本不同視角的信息,取得更好的聚類效果;另外,本發明方法能夠有效避免引入無法學習的超參數,對于無監督的聚類任務,具有更好的魯棒性。
技術領域
本發明屬機器學習技術領域,具體涉及一種基于自適應鄰近點的多視角聚類方法。
背景技術
多視角學習是近年來機器學習中的熱點研究領域之一,廣泛應用于場景分析、圖像分類及網頁信息處理等多個領域。在有些情況中,用單個視角的特征做聚類可以達到差強人意的結果,但如果合理地整合來自多個視角信息,則能夠取得更好的結果,這樣的方法即被稱為多視角聚類方法。
目前,現有的多視角聚類方法總體來說可以被分為三類:基于張量的方法、基于子空間的方法和基于圖的多視角聚類方法。其中,基于圖的多視角聚類方法較另外兩種方法能夠取得更好的效果,通常包含以下幾個步驟:首先,為每一個視角的特征分別構圖并計算相似度矩陣,然后,運用權重或罰項來整合這些相似度矩陣得到指示向量,最后,以這些指示向量為輸入,利用K均值方法進行聚類。Kumar等人在文獻“Kumar A,Rai P,Daume H.Co-regularized multi-view spectral clustering[A].Advances in Neural InformationProcessing Systems[C].2011.1413-1421.”中提出了一種協同規范譜聚類方法,該方法是第一個將半監督學習中的協同規范思想引入到譜聚類中,這樣使得各個視角的聚類結果達到一致。Li等人在文獻“Li Y,Nie F,Huang H,et al.Large-Scale Multi-View SpectralClustering via Bipartite Graph[C].AAAI.2015.2750-2756.”中提出了一種大規模多視角譜聚類方法,該方法在構圖的時候并不是為所有點分配與其相連接的鄰點,而是選取一些代表點,然后依據這個代表點與其他點的連接來構圖,大大降低了計算復雜度,適用于在大規模的數據集。Cai等人在文獻“Cai X,Nie F,Huang H,et al.Heterogeneous imagefeature integration via multi-modal spectral clustering[A].Computer Visionand Pattern Recognition(CVPR),2011[C].IEEE Conference on.IEEE,2011.1977-1984.”中提出了一種多模式譜聚類方法,使用一個統一的拉普拉斯矩陣來整合多模式數據,并對其加非負正交約束來提高方法的魯棒性。雖然基于圖的方法較能取得較好的聚類結果,但也有其局限性:首先,相似度矩陣的計算和后面的聚類過程是分離的,而后者很依賴前者,因此,不可靠的相似度矩陣會導致不好的聚類結果,并且,由于結果還依賴于類似K近鄰中近鄰的個數、高斯函數中帶寬的選擇等參數設定,傳統的構圖用K近鄰或者高斯函數的方法幾乎不能得到最好的圖;第二,以權重或者罰項的多視角整合方法都有參數需要調節,這對于無監督的聚類任務是非常不利的。
發明內容
為了克服現有技術的不足,本發明提供一種基于自適應鄰近點的多視角聚類方法。首先,計算待聚類樣本不同視角下的特征矩陣,并進行數據預處理,利用預處理后的數據和初始化權重求解所構建的帶秩約束的函數模型,得到初始鄰接圖;然后,構建基于自學習權重的多視角聚類函數模型,并進行迭代求解,得到最優鄰接圖;最后,求解得到最優鄰接圖的連通分量,即最終的聚類結果。本發明方法可以利用待處理樣本不同視角的信息,取得更好的聚類效果;另外,本發明方法能夠有效避免引入無法學習的超參數,對于無監督的聚類任務,具有更好的魯棒性。
一種基于自適應鄰近點的多視角聚類方法,其特征在于步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811559259.4/2.html,轉載請聲明來源鉆瓜專利網。





