[發明專利]一種基于稠密PCANet的魯棒圖像識別方法有效
申請號: | 202010147376.0 | 申請日: | 2020-03-05 |
公開(公告)號: | CN111488907B | 公開(公告)日: | 2023-07-14 |
發明(設計)人: | 李小薪;徐晨雅;胡海根;周乾偉;郝鵬翼 | 申請(專利權)人: | 浙江工業大學 |
主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 基于 稠密 pcanet 圖像 識別 方法 | ||
一種基于稠密PCANet的魯棒圖像識別方法,包括魯棒特征提取和基于卡方距離的最近鄰分類兩個步驟。魯棒特征提取過程使用了特征圖的稠密連接和模式圖的稠密編碼,稠密連接即將所有卷積層輸出的特征都合并起來,形成更寬的卷積層特征;稠密編碼即在利用卷積層進行模式圖編碼時,采用較小的跳躍幅度,使得模式圖盡可能地反應特征圖之間的相關性。分類過程包括:步驟1,在高維柱狀圖特征空間中,基于卡方距離獲取待識別圖像到各訓練圖像的距離度量;步驟2,獲取具有最小距離度量的訓練樣本所對應的類標,作為待識別圖像的類標。本發明能夠有效的處理待識別圖像中的遮擋、光照變化、分辨率差異等變化,從而有效地提升了有偏移圖像的識別率。
技術領域
本發明涉及圖像處理和模式識別領域,尤其是待識別圖像與訓練圖像有較大差異的魯棒圖像識別,主要用于處理和識別現實中的圖像。
背景技術
近來,在計算機視覺和圖像識別領域中,以卷積神經網絡(Convolutional?NeuralNetworks,CNN)為代表的深度神經網絡(Deep?Neural?Network,DNN)取得了極大的成功,在一些公開的數據集上,前沿的深度學習方法的分類能力甚至超過了人類,例如:在LFW人臉數據庫上的認證準確率,在ImageNet上的圖像分類準確率,以及在MNIST上的手寫數字識別準確率等。然而,在實際中,待識別圖像在“分布”或“結構”上往往與訓練圖像有較大的差異,這種差異會導致DNN出現較大規模的識別錯誤,在深度學習領域中,這一現象被稱為“協變量偏移(Covariate?Shift)”。
發明內容
為了克服現有圖像識別方法的協變量偏移所引發的圖像識別率較低的不足,本發明提出了一種基于稠密PCANet(Dense?PCANet,DPCANet)的魯棒圖像識別方法。DPCANet能夠有效克服由于協變量偏移所引發的識別問題,尤其是當待識別圖像存在遮擋、光照變化、分辨率差異等幅度較大的偏移時,能夠大幅度提升圖像識別性能。
本發明解決其技術問題所采用的技術方案是:
一種基于稠密PCANet的魯棒圖像識別方法,包括以下步驟:
步驟1選取J張圖像A={A1,…,AJ}作為訓練集,對應的類別標簽為Y={Y1,…,YK}為待識別圖像的集合,即測試集,這里,分別表示實數域上的具有C0∈{1,3}個通道的長寬為m×n的圖像;
步驟2初始化參數和輸入數據:令這里,用于指示網絡所處的階段,表示網絡處于訓練階段,表示網絡處于測試階段;令l=0,這里,l用于指示輸入圖像或特征圖在網絡中的層數,其中,N=J,令F={F1,…,FN}表示由各卷積層所生成的特征圖的集合,這里,表示空集;
步驟3由構建矩陣
其中,為的均值,表示從的第c個通道中抽取的第b∈{1,2,…,mn}個大小為k×k的特征塊,Vec(·)表示將矩陣拉伸為列向量的運算;
步驟4如果表示網絡處于測試階段,跳至步驟7,否則,執行下一步;
步驟5計算的主方向其中,為協方差矩陣的第i′個特征向量,對應的特征值為λi′,且
步驟6由V(l)獲取Cl+1個通道相關式濾波器組
步驟7按照如下步驟計算第l+1個卷積層的特征圖集X(l+1):7.1)將投影到7.2)將中的元素重新組織為特征圖集其中,且這里,表示的第c列的從第a到b行的列向量,a%b表示a對b取余,表示對實數a下取整,matm×n(ν)表示將任意列向量重新排列為m×n的矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010147376.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序