[發明專利]一種基于流形子空間學習的降維方法無效
| 申請號: | 201210324682.2 | 申請日: | 2012-09-04 |
| 公開(公告)號: | CN102867191A | 公開(公告)日: | 2013-01-09 |
| 發明(設計)人: | 莫錦佳;陶大鵬;毛慧蕓;張丹榕;黎小鳳 | 申請(專利權)人: | 廣東群興玩具股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66 |
| 代理公司: | 汕頭市潮睿專利事務有限公司 44230 | 代理人: | 郭曉剛;唐瑞雯 |
| 地址: | 515800 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 流形 空間 學習 方法 | ||
技術領域
本發明涉及一種模式識別與人工智能技術,更具體地說涉及一種基于流形子空間學習中的降維方法。
背景技術
在當今信息時代里,數據的一大特點就是日益的規?;c多樣化。而要對這些大規模的、多種多樣的復雜數據進行高效的組織、處理、分析,則離不開數據的降維處理,特別是對于一些復雜的高維數據,例如:視頻、語音、海量文本數據、氣候數據、基因數據、銷售數據、金融數據、由遙感技術產生的高光譜圖像數據等容易引發“維數災難”的大規模高維數據。對復雜、高維的數據進行降維處理,提取出數據中隱藏的低維、相對簡單的結構,一方面消除了原有數據的冗余性,另一方面避免了“維數災難”問題,提高了這些規?;呔S數據的可處理性。
數據降維需要解決的問題中,一個根本的問題是找到一個合適的投影,使原始數據從高維空間變換到低維子空間。它的目的是簡潔、有效地表達出樣品在原始高維空間的分布。由于數據降維算法可以應用到各種各樣的應用中,比如人臉識別、場景分析、對象分類和生物統計等,因此在過去的幾十年中,許多降維算法已經被提出。這些算法可以劃分為兩大類:全局線性降維算法和基于流形學習的降維算法。在最近幾年里,還有一種分片線性算法被提出。這種方法通過利用分片線性子模型實現,近似于非線性模型。分片線性算法可以看作是一個全局線性降維算法和基于流形學習的降維算法的結合。
傳統的全局線性降維的方法主要是基于線性的,其中主成分分析法(PCA)、線性判別分析法(LDA)被廣泛地應用在模式分類問題上。主成分分析法是一個標準的、高效的數據降維算法,它通過對原本是高斯分布的數據進行重新構造,從而提供了一個從高維數據中提取低維有用信息的有效方法。然而,由于它不使用類標簽信息,對于分類問題來說,主成分分析法并不是一個最佳的選擇。主成分分析法是無監督學習算法的代表,線性判別分析法則為典型、傳統的有監督學習方法。線性判別分析法主要通過最大化類間距離的同時使類內樣本間距離最小,從而實現不同類別之間的可分性。但是,線性判別分析法在實現中存在以下問題:1)忽略數據可能存在的非線性特點;2)假設所有的樣品對分類的貢獻相等;3)面臨矩陣的奇異性問題。
除了以上提及的問題之外,總的來說,這兩種方法通常適用于大樣本情況各類模式識別問題。由于沒有考慮到樣本在原始空間的局部分布情況,特別是在小樣本學習時,降維性能下降很快。針對這一問題,近年來各地的研究者提出了大量流形子空間降維的方法。流形子空間降維方法的提出,是基于通常有限的自由度決定數據的高維特征本質這一事實,并且假設所處理的數據采樣于一個潛在的流形上。因此,在理論上來說,只要針對有限的離散數據樣本進行學習,構建高維離散數據間的相鄰圖,展開在高維空間中呈現折疊狀態的曲面,展示出高維數據的隱藏的拓撲結構,獲得原始數據的高維特征內嵌子空間,即隱藏在高維數據中的潛在低維流形。當今,具有代表性的流形學習方法有等距特征映射(isometric?feature?mapping,ISOMAP),局部保形映射(LPP),邊界Fisher分析(MFA),判別局部塊配準(DLA)等等。這些方法都從樣本的局部幾何信息建模開始,提出了不同的優化目標,在人臉識別、場景分析、目標分類取得了很好的效果。然而這些方法也有其自身的缺點,如:等距特征映射不能利用樣本的標注信息;邊界Fisher分析只考慮邊緣樣本的判別信息;判別局部塊配準不能很好的保留類間樣本的位置關系等等。為了克服以上提到的所有缺點,本發明利用塊配準模型(PAF)提出了判別信息保留法(DIP),這一新的降維方法在克服以上問題的同時加強了從局部中提取到的判別信息所表現出的效果。判別信息保留法通過1)重視局部幾何信息建模,利用塊配準模型(PAF)形式的局部保形投影,很好地適應了數據可能存在的非線性特點;2)通過最大化邊緣對類間樣本的判別信息進行保留,使得判別信息保留得比其他算法都要好;3)避免了求矩陣的逆運算,從而避開了不適定問題(ill-posed?problem)。
發明內容
本發明所要解決的技術問題是針對上述現有流形子空間學習方法中的不足,提供一種基于流形子空間學習的降維方法,這種基于流形子空間學習的降維方法利用判別信息保留這一新的降維方法解決模式分類中的特征提取問題,即尋找一個新的分類最優子空間,在該空間中,以保留類內樣本局部幾何結構為限制條件,最大化類間樣本的邊緣距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東群興玩具股份有限公司,未經廣東群興玩具股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210324682.2/2.html,轉載請聲明來源鉆瓜專利網。





