[發明專利]基于有監督圖的直推式數據降維方法有效
| 申請號: | 201610008366.2 | 申請日: | 2016-01-07 |
| 公開(公告)號: | CN105678261B | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 王磊;姬紅兵;王家俊;朱明哲;李丹萍 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 王品華;張問芬 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監督 直推式 數據 方法 | ||
本發明公開了一種直推式局部保持投影數據降維方法,主要解決現有基于半監督學習的數據降維方法僅利用歐氏距離進行構圖,識別結果不理想的問題。其實現步驟是:(1)輸入數據并歸一化;(2)計算歸一化后的原始矩陣及類標向量;(3)由原始數據計算第一拉普拉斯矩陣L;(4)由類標向量計算第二拉普拉斯矩陣Ll;(5)由第一拉普拉斯矩陣L和第二拉普拉斯矩陣Ll計算相似度矩陣S;(6)由類標向量計算樣本的類間權重矩陣Wc;(7)由相似度矩陣S和類間權重矩陣Wc構建廣義特征值公式并求解,得到投影矩陣E;(8)由投影矩陣E計算出降維后的樣本。本發明能有效地對數據進行特征提取與降維,提高了數據分類識別的準確率,可用于數據與圖像處理。
技術領域
本發明屬于圖像處理技術領域,特別涉及一種高維數據降維方法,可用于數據與計算機圖像識別。
背景技術
近些年來,隨著計算機技術和制造業的發展,智能設備已經全面普及,比如智能手機,智能手環等等。幾乎每臺智能設備都有大量的傳感器,從而采集各方面的數據。大量智能設備的普及隨之而來的是原始數據的爆炸性增長。當我們獲得越來越多的數據,如何充分利用數據中的信息,已經成為學術界研究的焦點。數據降維就是用于解決這些問題的有效手段。數據降維旨在利用普及的計算機自動的探索原始數據中的信息,發現潛藏在大量的混亂數據背后的本質特征。數據降維的主要代表方法有主成分分析PCA,局部保持投影LPP,線性判別分析LDA等。
隨著信息技術以及傳感器技術的發展,通過傳感器可直接獲取的大量無標記樣本,相比之下,有標記的樣本則難以獲得。比如醫學圖像處理,通過現代化的儀器獲取數量龐大的醫學影像是容易的,但是讓醫生人工標注全部圖像,需要耗費昂貴的人力物力。而直推式降維方法最顯著的優點是自動地結合少量的標記樣本和大量的未標記樣本進行訓練來完成數據降維,明顯的提高了效率并且降低了人力成本,具有重要的現實意義。目前,直推式降維方法已經成功地應用于人臉識別、圖像分類、圖像檢索等領域中。
直推式降維方法的基本模型如下:給定一個d維隨機向量x,它的n個觀察值被記作xj(j=1,2,...n),構成矩陣X=(x1,x2,...,xn)。其中有標記數據集為V={(x1,k1),(x2,k2),...,(xl,kl)},無標記數據集為U={xl+1,xl+2,...,xn},并有X=V∪U,其中,kj是數據xj的類標,l是有標記樣本數量。將矩陣X投影到r(r<<d)維的子空間中去,并且有Y=XE。其中Y∈Rn×r降維后的矩陣,E∈Rd×r是投影矩陣。這種方法通過選擇合適投影矩陣可以壓縮原始數據的維度,找出數據的本質特征。
Sugiyama等人于2010年提出了半監督局部費舍爾判別分析SELF方法,SELF的基本思想是用基于全局分布結構的PCA來懲罰LFDA在標記樣本很少的情況下地過度擬合。但是該方法沒有考慮全部樣本的局部結構信息。
劉威等人提出了一種同時訓練標記樣本和預測樣本的直推式成分分析TCA。該TCA方法是利用雙重優化準則來訓練基于幾何圖框架的特征子空間。但是該方法在投影k近鄰圖時沒有考慮樣本的類標信息。
因此,上述SELF和TCA方法降維后數據的分類識別效果均不理想。
發明內容
本發明的目的在于針對上述已有技術的不足,提出一種基于有監督圖的直推式數據降維方法,以在無標記樣本數量較多和有標記樣本數量較少的情況下,有效地實現對數據的特征提取及降維,進而提高后續的數據分類效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610008366.2/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





