[發明專利]基于小波變換的漸進式深度卷積網絡圖像識別方法及裝置有效
| 申請號: | 201910783600.2 | 申請日: | 2019-08-23 |
| 公開(公告)號: | CN110633735B | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 何志權;曹文明;劉啟凡 | 申請(專利權)人: | 深圳大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京東和長優知識產權代理事務所(普通合伙) 11564 | 代理人: | 周捷 |
| 地址: | 518060 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 變換 漸進 深度 卷積 網絡 圖像 識別 方法 裝置 | ||
本發明提供一種基于小波變換的漸進式深度卷積網絡圖像識別方法及裝置所述方法包括:選取訓練圖像集,對訓練圖像進行小波分解,獲得所述訓練圖像的成分圖像;訓練漸進式深度卷積神經網絡模型;判斷所述漸進式深度卷積神經網絡模型是否穩定;若是,獲取待識別圖像,利用預先訓練好的所述漸進式深度卷積神經網絡模型識別圖像。根據本發明的方案,利用圖像小波變換所提供的對圖像的多尺度、多層級的表示,進行漸進式深度卷積神經網絡的設計,能自動選擇最小化的成分圖像組合來實現圖像的準確識別,能夠加快深度學習模型的運算速度,消耗最小化計算資源。
技術領域
本發明涉及圖像處理領域,尤其涉及一種基于小波變換的漸進式深度卷積網絡圖像識別方法及裝置。
背景技術
近幾年,深度學習模型得到了飛速的發展,在越來越多的領域得到了成功的應用,其中一個應用是進行圖像識別。深度學習模型通常包含大量的參數,運行深度學習模型時需要占用大量的內存資源,并且還需要較大的運算量。現有的用于圖像識別的使用了深度學習模型的深度神經網絡,一但深度神經網絡訓練完畢,對任何輸入圖像,其網絡結構、執行過程和計算復雜度都是固定不變的,無法適應動態變化的應用場景。例如圖1A所示的場景復雜的小貓圖像和圖1B所示的場景簡單的小貓圖像,使用深度神經網絡進行圖像識別時,其執行過程、計算復雜度都是一樣的。而實際上,圖1B所示的場景簡單的小貓圖像使用低分辨率或少數的網絡層級就可以實現準確的識別,使用固定層級的深度神經網絡進行識別,會造成大量的計算資源的浪費。
現有技術中提出了可伸縮的深度學習神經網絡,可伸縮的深度學習神經網絡的實現方式是把主網絡分成若干個層級,從待識別圖像的原圖提取特征,并通過復雜的決策網絡來決定主網絡在什么時候提前退出。現有的可伸縮的深度學習神經網絡仍存在主網絡層數固定、計算量大、資源消耗大、計算速度慢的不足。
發明內容
為解決上述技術問題,本發明提出了一種基于小波變換的漸進式深度卷積網絡圖像識別方法及裝置,用以解決現有技術中主網絡層數固定、計算量大、資源消耗大、計算速度慢的技術問題。
根據本發明的第一方面,提供一種基于小波變換的漸進式深度卷積網絡圖像識別方法,包括:
步驟S101:選取訓練圖像集,對訓練圖像Xk進行小波分解,獲得所述訓練圖像的成分圖像I1…Im;
步驟S102:訓練漸進式深度卷積神經網絡模型,包括:構建M個單獨的DNN子網絡N1…Ni…NM(1≤i≤M)組成的漸進式深度神經網絡層,將所述成分圖像I1…Im分別輸入對應的DNN子網絡N1…Nm,輸出成分圖像I1…Im對應的特征F1…Fm,各個數據通道R1-Rm上進行特征融合,將通道Ri獲得的成分圖像Ii對應的特征Fi與在前的數據通道Ri-1對應的特征Fi-1融合,第一數據通道R1融合后特征仍為F1;將各通道上融合后的特征F1…Fm分別輸入各自對應的評估子網絡E1…Em,各評估子網絡E1…Em用于計算各評估子網絡的損失函數,并將所述損失函數值輸入決策控制網絡,由決策控制網絡確定識別訓練圖像Xk所需的DNN子網絡的最少層級;
所述決策控制網絡的損失函數定義為
L=LE+αLCADP-βLwavelet,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳大學,未經深圳大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910783600.2/2.html,轉載請聲明來源鉆瓜專利網。





