[發明專利]基于Schatten Capped p范數的數據恢復方法有效
| 申請號: | 201910432024.7 | 申請日: | 2019-05-23 |
| 公開(公告)號: | CN110120026B | 公開(公告)日: | 2022-04-05 |
| 發明(設計)人: | 李國瑞;郭光 | 申請(專利權)人: | 東北大學秦皇島分校 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06F17/16 |
| 代理公司: | 北京聯創佳為專利事務所(普通合伙) 11362 | 代理人: | 郭防;劉美蓮 |
| 地址: | 066000 河北省秦*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 schatten capped 范數 數據 恢復 方法 | ||
本發明公開了一種基于Schatten Capped p范數的矩陣補全方法,包括以下步驟:S1,對輸入的不完備數據矩陣求出其對應的正交映射算子所述的正交映射算子表示數據矩陣D的對應項不為空的位置的集合;表示恢復后的矩陣;S2,定義矩陣的Schatten Capped p范數其中表示截斷參數,θi表示矩陣的第i個奇異值,p表示冪指數,p∈(0,1];S3,求解下式的最優化問題,直至收斂,輸出補全的數據矩陣s.t.EΩ=XΩ?DΩ,X=W,其中,W為等價變量,γ為懲罰參數。通過本發明的方法進行矩陣補全,使得數據矩陣是低秩的,而且可以保證主要信息不損失,數據恢復精度高,即本發明對于具有低秩性質的不完備矩陣有很好的恢復效果。
技術領域
本發明涉及一種基于Schatten Capped p范數的數據恢復方法,屬于數據恢復技術領域。
背景技術
在機器學習和數據挖掘工作中,諸如計算機視覺、協同過濾、信號處理、推薦系統等領域,工程師往往會根據低維特征(部分信息)大概率地恢復出高維信息(原始數據),此類工作可以進行的原因就是原始信息抽象出的數據具有稀疏或者低秩的特點,向量的稀疏性對應于矩陣的低秩性。矩陣填充正是低秩性質最經典的應用之一。
矩陣填充處理的問題是事先假定數據矩陣是低秩的,矩陣元素間有相關性,那么缺失的數據就可以根據最小化矩陣的值用觀測的數據恢復出來。對于給定一不完備的矩陣D是低秩的,該矩陣的填充問題可以描述為如下:
矩陣并且Ω是與觀測項相關的位置集合,即D是觀測數據(observeddata),是不完備數據(incomplete data),而X是最終補全的數據。由于秩函數是非凸的且不連續的,所以上述公式(1)的最小化問題是NP難問題。通常的對于公式(1)的解法是將秩函數用核范數來代替,因為理論證明核范數是秩函數的最緊凸下界,而且核范數是凸的連續函數。秩函數和核范數的關系類似于l0范數和l1范數的關系,雖然最小化核范數的矩陣補全問題是凸的,在全局可以找到最優解,但是這種凸松弛可能會和原始的數據有較大的偏差,因此需要找到一種更好的近似方式。
對于核范數的近似,往往需要犧牲凸函數的性質,以求獲得更好的效果。其中Schatten p norm和Capped norm受到了很多學者的關注,這兩大類范數都是秩函數非凸的近似。但Schatten p norm將每一個奇異值都考慮進來,不符合低秩的特點(對于較小的奇異值,往往有噪聲,應該去掉,如果保留會使得恢復效果變差),Capped norm則是只考慮了秩的大小,可能會將一些信息丟失(Capped norm本質是將較小的奇異值置為0,將較大的奇異值減去一小部分,這樣雖然使得秩降低了,但也損失了一些主要信息),從而導致數據恢復的效果較差。此外,現有的TNNR-APGL算法、Logarithm-ADMM算法和Logarithm-IRNN算法也通常用于矩陣補全,進行數據的恢復,但是整體而言,它們的數據恢復質量仍然不夠理想。因此需要進一步改進。
發明內容
本發明的目的在于,提供一種基于Schatten Capped p范數的數據恢復方法,它可以有效解決現有技術中存在的問題,實現數據的高精度、高質量恢復。
為解決上述技術問題,本發明采用如下的技術方案:一種基于Schatten Capped p范數的數據恢復方法,包括以下步驟:
S1,對輸入的待恢復的原始數據的不完備數據矩陣求出其對應的正交映射算子所述的正交映射算子表示數據矩陣D的對應項不為空的位置的集合(同理表示數據矩陣D對應項為空的位置的集合,所以Ω+Ωc=ones(m,n));表示恢復后的矩陣;
S2,定義矩陣的Schatten Capped p范數其中表示截斷參數,θi表示矩陣的第i個奇異值,p表示冪指數,p∈(0,1];
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學秦皇島分校,未經東北大學秦皇島分校許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910432024.7/2.html,轉載請聲明來源鉆瓜專利網。





