[發明專利]基于隱表示和自適應的多視圖子空間聚類方法在審
| 申請號: | 201810801776.1 | 申請日: | 2018-07-20 |
| 公開(公告)號: | CN109002854A | 公開(公告)日: | 2018-12-14 |
| 發明(設計)人: | 王秀美;張越美;高新波;張天真;李潔;鄧成;田春娜 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標函數 聚類 自適應 矩陣 子空間 原始數據集 視圖聚類 視圖數據 優化 準確率 交替迭代 生物分類 圖像分割 系數矩陣 初始化 構建 可用 商務 分析 | ||
本發明提出了一種基于隱表示和自適應的多視圖子空間聚類方法,主要解決多視圖聚類方法中存在的聚類準確率低的問題,實現步驟為:(1)獲取原始數據集的多視圖數據矩陣;(2)計算多視圖數據矩陣的拉普拉斯矩陣;(3)構建基于隱表示和自適應的多視圖子空間聚類的目標函數;(4)對目標函數進行優化;(5)對優化后的目標函數中的變量進行初始化;(6)對優化后的目標函數中的變量進行交替迭代;(7)計算優化后的目標函數中的多視圖自表示系數矩陣的值;(8)對原始數據集進行聚類。本發明利用隱表示和自適應,充分利用多個視圖的信息,有效提高了多視圖聚類的準確率,可用于圖像分割,商務分析,生物分類等領域。
技術領域
本發明屬于計算機視覺和模式識別技術領域,涉及一種多視圖子空間聚類方法,具體涉及一種基于隱表示和自適應的多視圖子空間聚類方法,可用于圖像分割,商業分析以及生物分類等。
背景技術
近年來,由于計算機信息技術的快速發展,在新興技術改變人類社會的同時,隨之而來的還有數據的爆發式增長,因此數據的獲取和分析變得越來越重要。數據挖掘是在大量數據中發現隱藏信息、提取知識的一個過程。聚類作為一種重要的數據挖掘方法,是將物理或抽象對象的集合分成由類似的對象組成的多個簇的過程,使得同一個簇中的對象具有較高的相似性,不同簇中的對象具有較低的相似性。
傳統的數據集是用單一的特征表示的,稱為單視圖數據集。但是單視圖數據集中所包含的原始數據集中的信息并不完整,為解決這一問題,現有技術使得數據集可以用多種特征進行表示,稱為多視圖數據集。例如,同一張圖片可以用SIFT和HOG等特征進行描述;對于同一篇新聞報道,可以使用不同的語言進行表達;對于網頁數據,文本和鏈接信息可以作為兩個不同的視圖。如果采用傳統聚類方法對這種數據集進行聚類,由于不能充分利用多個視圖的信息,聚類效果往往不夠理想。因此,多視圖聚類被提了出來。多視圖聚類通過利用多個視圖的一致性和差異性,往往能得到更加準確的聚類結果。
多視圖聚類算法可分為基于K均值的多視圖聚類算法和基于譜聚類的多視圖聚類算法兩類,基于K均值的多視圖聚類算法,由于其初始點的選擇是隨機的,而聚類的結果與初始點的選擇相關性比較大,因此該類方法聚類的結果具有不穩定性。
基于譜聚類的多視圖聚類算法由于能夠保持數據集的樣本之間的局部幾何結構,往往能得到較為穩定的聚類結果,因此出現了很多基于譜聚類的多視圖聚類算法。
由于數據集中的樣本是分布在特定的低維子空間上的,基于這個事實,近年來,出現了很多子空間聚類(Subspace Clustering,SC)算法,子空間聚類是譜聚類算法當中的一部分。該類算法利用任意樣本可以用該樣本所在的子空間中的樣本進行線性組合這一性質,將數據矩陣分解為數據矩陣和視圖自表示系數矩陣的乘積。進而利用視圖自表示系數矩陣獲得聚類結果。由于視圖自表示系數矩陣具有較好的可解釋性和明確的物理意義等優點,子空間聚類成為數據聚類的基本工具,并且在單視圖聚類和多視圖聚類當中具有廣泛的應用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810801776.1/2.html,轉載請聲明來源鉆瓜專利網。





