[發(fā)明專利]一種基于無監(jiān)督特征學習的圖像分類方法在審
| 申請?zhí)枺?/td> | 202010173425.8 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111401434A | 公開(公告)日: | 2020-07-10 |
| 發(fā)明(設計)人: | 聶飛平;陸繼韜;王榕;李學龍 | 申請(專利權)人: | 西北工業(yè)大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/34 |
| 代理公司: | 西北工業(yè)大學專利中心 61204 | 代理人: | 常威威 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監(jiān)督 特征 學習 圖像 分類 方法 | ||
本發(fā)明提供了一種基于無監(jiān)督特征學習的圖像分類方法。首先,構建圖塊矩陣,并利用PCA算法學習濾波器組、進行特征圖降維,再將輸出作為輸入,重復此過程以構建深層網絡,得到兩層降維后的特征圖集合;然后,將降維后的特征圖進行二值化,計算哈希值并分塊統(tǒng)計直方圖,得到原始圖像的特征嵌入;接著,利用原始圖像標簽和特征嵌入對分類器進行訓練;最后,對未標識的待分類圖像計算特征嵌入并利用訓練好的分類器進行處理,得到最終分類結果。
技術領域
本發(fā)明屬機器學習和計算機視覺技術領域,具體涉及一種基于無監(jiān)督特征學習的圖像分類方法。
背景技術
隨著計算能力的飛速提升和數(shù)據(jù)的爆炸式增長,以卷積神經網絡(ConvNet或CNN)為代表的深度學習方法在多種計算機視覺任務中取得了巨大的成功。眾所周知,數(shù)據(jù)的特征提取對于機器學習的性能有著重要影響。CNN取得成功的主要原因之一,就是它通過級聯(lián)的卷積濾波器提取圖像多層次的語義信息,優(yōu)于傳統(tǒng)的手工設計的特征。CNN通常是有監(jiān)督的,而網絡上公開的免費數(shù)據(jù)集不一定適用于當前的任務,因此使用者通常需要付出高額的成本收集適用于欲完成任務的數(shù)據(jù),并聘請人工對數(shù)據(jù)進行標記以便用于網絡的訓練。為了克服對數(shù)據(jù)標簽的依賴,降低獲取數(shù)據(jù)的成本,人們提出了許多無監(jiān)督學習方法,即從大量未標記的圖片和視頻等樣本中自動學習特征。使用無監(jiān)督方法取代當前大規(guī)模應用的有監(jiān)督方法,具有極高的經濟價值與社會價值,是當前機器學習研究中的一個熱點領域。
圖像分類問題是計算機視覺中最基礎、最重要也最具有挑戰(zhàn)性的任務之一,是其他“高級”任務,如目標檢測、語義分割、行人識別等的基礎,提高圖像分類的性能將間接提高其他數(shù)十項計算機視覺任務的性能。圖像分類任務十分具有挑戰(zhàn)性,主要原因是同一類圖像中可能存在巨大的類內差異。
由于低級特征對類內差異的敏感性較低,人們曾花費了眾多精力手工設計各種低級特征來克服類內差異。如文獻“Jain A K,Farrokhnia F.Unsupervised texturesegmentation using Gabor filters[J].Pattern recognition,1991,24(12):1167-1186.”設計了用于紋理分類的特征,文獻“Ahonen T,Hadid A,Pietikainen M.Facedescription with local binary patterns:Application to face recognition[J].IEEE Transactions on Pattern AnalysisMachine Intelligence,2006(12):2037-2041.”設計了用于面部分類的特征,文獻“Lowe D G.Distinctive image features fromscale-invariant keypoints[J].International journal of computer vision,2004,60(2):91-110.設計特征用于物體分類,文獻Dalal N,Triggs B.Histograms of orientedgradients for human detection[C].2005.”設計了用于行人檢測的特征等等。盡管這些手工設計的特征在特定領域的任務中取得了巨大的成功,但絕大多數(shù)手工設計的特征無法簡單適應新條件,為新任務設計有效的特征通常需要設計者擁有特定領域的知識。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業(yè)大學,未經西北工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010173425.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:應用于顯示設備的內容展示方法、裝置和電子設備
- 下一篇:一種吊頂定位裝置





