[發明專利]一種深度學習網絡實現大類別圖像識別的方法在審
| 申請號: | 201310461551.3 | 申請日: | 2013-09-30 |
| 公開(公告)號: | CN103489004A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 郭禮華;黃健翀 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 陳文姬 |
| 地址: | 511458 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深度 學習 網絡 實現 類別 圖像 識別 方法 | ||
技術領域
本發明涉及模式識別與人工智能技術領域,特別涉及一種深度學習網絡實現大類別圖像識別的方法。
背景技術
圖像識別是指根據要求識別出當前給出的圖像或搜索到的圖像是否所需圖像的一種技術,它是模式識別與人工智能技術領域中一個重要研究內容,目前已有許多的圖像識別的研究成果,如專利200710179461.X提出一種基于特征提取和分類器的圖像識別方法。它通過經訓練的判別器選擇適用于測試圖片的不同類別的特征類別和分類器,從而使得圖像識別能夠適用于不同的環境,并通過所選擇的多個類別的特征提取和分類器組合分別進行圖像識別,即有效組織多種特征提取方法和多種分類器進行圖像識別,然后再根據多個組合得到的識別結果綜合決策,從而提高了圖像識別結果的可靠性。專利201110081240.5提出一種基于提升稀疏約束雙線性模型的圖像進行分類方法,該方法首先在圖像上提取圖像的局部特征;然后從圖像上密集的提取多個部件;接著將各個部件用視覺詞的直方圖作為部件的特征表示,并將每個部件的特征表示按順序排列起來,用一個矩陣的形式來表示圖像;最后使用提升稀疏約束雙線性模型模擬視覺詞到部件、部件到圖像類別之間的關系,從而達到對圖像分類的目的。專利201110049008.3提出了基于特征值高斯統計特性的極化SAR圖像分類方法,主要解決現有技術對特征分布特性認知上不足和類別判決界限需要人為確定的問題。該發明具有對極化SAR圖像分類效果顯著的優點,可用于極化SAR圖像目標檢測和目標識別。目前的圖像識別的方法主要還是通過提取圖像的局部特征,但是由于圖像的局部特征缺乏語義性,所以當處理大類別圖像識別的時候,其性能不太理想。
發明內容
為了克服現有技術的上述缺點與不足,本發明的目的在于提供一種深度學習網絡實現大類別圖像識別的方法,克服傳統方法提取局部特征時語義信息的缺乏,能顯著提升多類別圖像識別的識別率。
本發明的目的通過以下技術方案實現:
一種深度學習網絡實現大類別圖像識別的方法,采用深度學習網絡進行大類別圖像識別,所述深度學習網絡包括第一簡單層S1層,第一復雜層C1層,第二簡單層S2層和第二復雜層C2層;
識別過程包括以下步驟:
(1)訓練過程:
(11)對樣本圖片進行預處理,所述樣本圖片包括多種類別;
(12)對樣本圖片進行Gabor特征提取,得到Gabor特征矩陣,即S1層中的特征矩陣;
(13)對步驟(12)得到的S1層中的特征矩陣進行局部最大選取,得到局部最大化的Gabor特征矩陣,即C1層中的特征矩陣;
(14)使用特征碼本對步驟(13)得到的C1層中的特征矩陣進行局部線性編碼,得到S2層中的特征矩陣;
(15)使用空間金字塔方法對步驟(14)得到的S2層中的特征矩陣進行最大選取,得到視覺圖像特征和局部線性編碼相結合的特征矢量,即C2層的特征矢量:
(16)將步驟(15)得到的C2層的特征矢量送入支持向量機分類器進行訓練;
(2)識別過程:
(21)對測試圖片進行預處理;
(22)對測試圖片進行Gabor特征提取,得到Gabor特征矩陣,即S1層中的特征矩陣;
(23)對步驟(22)得到的S1層中的特征矩陣進行局部最大選取,得到局部最大化的Gabor特征矩陣,即C1層中的特征矩陣;
(24)使用特征碼本對步驟(23)得到的C1層中的特征矩陣進行局部線性編碼,得到S2層中的特征矩陣;
(25)使用空間金字塔方法對步驟(24)得到的S2層中的特征矩陣進行最大選取,得到視覺圖像特征和局部線性編碼相結合的特征矢量,即C2層的特征矢量:
(26)將步驟(25)得到的C2層的特征矢量送入步驟(16)訓練好的支持向量機分類器進行識別。
步驟(14)所述使用特征碼本對步驟(13)得到的C1層中的特征矩陣進行局部線性編碼,具體為:
在C1層中,對于樣本圖片中任意點,當以該點為基點時,在該基點周圍提取特征碼本中的特征模板大小內的各點,并轉為一維特征矢量,使用特征碼本對一維特征矢量進行局部線性編碼;對樣本圖像所有基點進行局部線性編碼后,得到C1層中的特征矩陣經過局部線性編碼的編碼結果,此編碼結果為S2層中的特征矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310461551.3/2.html,轉載請聲明來源鉆瓜專利網。





