[發明專利]一種非負矩陣分解聚類方法、裝置及可讀存儲介質在審
| 申請號: | 202110997053.5 | 申請日: | 2021-08-27 |
| 公開(公告)號: | CN113705674A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 張斌;李瑞瑜;郭宇;張雪濤;王飛 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 房鑫 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 矩陣 解聚 方法 裝置 可讀 存儲 介質 | ||
1.一種非負矩陣分解聚類方法,其特征在于,包括以下步驟:
將輸入數據映射到高維非線性空間;
自適應學習高維非線性空間下數據的潛在拓撲關系,獲得樣本間的鄰接矩陣,并以拓撲關系約束高維映射數據的非負分解結果矩陣,完成高維空間下子流形的聚類;
通過分解非線性映射的樣本矩陣得到系數矩陣,作為聚類標簽,使用高維非線性空間下自適應學習得到的流形結構對其進行約束,獲取高維非線性空間下的聚類結果。
2.根據權利要求1所述非負矩陣分解聚類方法,其特征在于,所述的自適應學習高維非線性空間下數據集的潛在拓撲關系,獲得樣本間的鄰接矩陣具體包括:
使用全局結構保留方法映射子空間與原高維非線性空間的結構相似度進行獲取。
3.根據權利要求2所述非負矩陣分解聚類方法,其特征在于,對于任意給定的一個非負矩陣X∈Rm×n,其中m和n分別對應這個矩陣的行和列;則按照下式在數據集X上對數據進行核映射和非負矩陣分解以獲得基于原始圖像的表示形式:
式中,H為非負的系數矩陣,F為映射空間中的基矩陣。
4.根據權利要求2所述非負矩陣分解聚類方法,其特征在于:
對輸入數據映射出的矩陣構建相似圖S以保留對應的核相似性,通過將每個數據編碼為其他樣本的加權組合來表示兩個樣本之間的相似性,構造表達式如下:
式中,γ和μ是權衡參數,S為相似性矩陣,項用于防止出現平凡解。
5.根據權利要求4所述非負矩陣分解聚類方法,其特征在于:由相似性矩陣構造具有局部數據結構信息的圖正則化項,測量每兩個樣本之間的距離,并根據相似性矩陣來衡量兩個樣本;如果數據分布的原始幾何圖形中彼此接近,則兩個點的低維表示形式也彼此接近。
6.根據權利要求5所述非負矩陣分解聚類方法,其特征在于,通過求解下式添加圖正則化項:
將上式轉化為矩陣跡形式如下:
min βTr(HTLSH)s.t.H≥0,S≥0
式中,β為圖正則化項參數,L為拉普拉斯矩陣,L=D-S,D為對角線矩陣,其對角線元素為S的對角線元素。
7.根據權利要求6所述非負矩陣分解聚類方法,其特征在于,所述的使用高維非線性空間下自適應學習得到的子流形結構對其進行約束,獲取高維非線性空間下的聚類結果具體包括:
將非負矩陣分解目標式、全局結構圖學習目標式以及學習圖正則化項聯合,建立總體優化目標函數如下:
s.t.F≥0,H≥0,S≥0
定義核矩陣則對于內核空間的子空間元素被表示為:
因此,上述聯合建立的總體優化目標函數使用核技巧展開為:
8.根據權利要求7所述非負矩陣分解聚類方法,其特征在于,對于提出的損失函數通過交替迭代求解的方法,對每個變量求出局部最優解,進行迭代優化。
9.一種非負矩陣分解聚類裝置,其特征在于,包括:
映射模塊,用于將輸入數據映射到高維非線性空間;
自適應學習模塊,用于自適應學習高維非線性空間下數據的潛在拓撲關系,獲得樣本間的鄰接矩陣,并以拓撲關系約束高維映射數據的非負分解結果矩陣,完成高維空間下子流形的聚類;
分解聚類模塊,用于通過分解非線性映射的樣本矩陣得到系數矩陣,作為聚類標簽,使用高維非線性空間下自適應學習得到的流形結構對其進行約束,獲取高維非線性空間下的聚類結果。
10.一種計算機可讀存儲介質,存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至8中任一項所述非負矩陣分解聚類方法中的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110997053.5/1.html,轉載請聲明來源鉆瓜專利網。





