[發明專利]一種基于卷積神經網絡的圖像分類方法和裝置有效
| 申請號: | 201310477564.X | 申請日: | 2013-10-12 |
| 公開(公告)號: | CN103544506B | 公開(公告)日: | 2017-08-08 |
| 發明(設計)人: | 周龍沙;邵詩強 | 申請(專利權)人: | TCL集團股份有限公司 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66;G06N3/02 |
| 代理公司: | 深圳市君勝知識產權代理事務所(普通合伙)44268 | 代理人: | 王永文,劉文求 |
| 地址: | 516001 廣東省惠州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 圖像 分類 方法 裝置 | ||
1.一種基于卷積神經網絡的圖像分類方法,其特征在于,包括以下步驟:
A、接收輸入的多個類別的圖像樣本,對輸入的每一個類別的圖像樣本數據進行歸一化,將歸一化后的圖像樣本數據進行卷積,再采用預定的非對稱映射矩陣對卷積后的圖像樣本數據進行映射,并將映射后的圖像樣本數據進行排列得到對應的一維特征描述,根據所述一維特征描述計算出每一個類別的圖像對應的神經網絡權值;
B、采用分層結構對多個類別圖像的對應神經網絡權值進行分布,且每一層分布的類別數目為根據所述非對稱映射矩陣確定的最大區分類別數目,將多個類別圖像在多層中依次分布,每一層形成對應的學習庫;
C、對輸入的測試類別圖像樣本數據進行處理得到對應的一維特征描述,將所述測試類別圖像樣本數據對應的一維特征描述與所述學習庫中的神經網絡權值進行前饋學習,從而判斷出所述測試類別是否在所學習的類別圖像中。
2.根據權利要求1所述的基于卷積神經網絡的圖像分類方法,其特征在于,所述步驟A具體包括:
A1、接收輸入的多個類別的圖像樣本,將輸入的每一個類別的圖像樣本數據進行歸一化;
A2、對歸一化的圖像樣本數據進行卷積,得到相應的多個卷積結果;
A3、對多個卷積結果進行一半的降采樣;
A4、對降采樣后的卷積結果進行再次卷積,并采用預定的非對稱映射矩陣對卷積后的圖像樣本數據進行映射;
A5、對映射后的圖像樣本數據進行一半的降采樣,并對降采樣的結果進行排列得到該圖像的一維特征描述;
A6、對所述一維特征描述進行預定的降采樣得到縮減后的特征向量;
A7、將所述特征向量輸入神經網絡,進入神經網絡的學習過程,進行前饋學習和BP反饋方式調節,得到相應的神經網絡權值。
3.根據權利要求1所述的基于卷積神經網絡的圖像分類方法,其特征在于,所述步驟B具體包括:
B1、對N個類別的圖像樣本,根據所述非對稱映射矩陣確定的最大區分類別數目M;
B2、建立NUM層學習類別,NUM為(N/(M-1))取向上的整數;
B3、對于每一層,采用最大區分類別數目M個類別來構建,依次在NUM層中來完成N個類別的分布;
B4、通過卷積神經網絡來對每一層進行學習并形成每一層所對應的學習庫。
4.根據權利要求1所述的基于卷積神經網絡的圖像分類方法,其特征在于,所述步驟B還包括:
B5、當有新的類別加入時,放入最后一組分層中并對該層重新進行學習形成新的學習庫。
5.根據權利要求3所述的基于卷積神經網絡的圖像分類方法,其特征在于,所述步驟C具體包括:
C1、對輸入的測試類別圖像樣本數據進行處理得到對應的一維特征描述;
C2、進入第i層,其中i=1,2,3……NUM,i初始化為1,即將測試類別圖像樣本數據對應的一維特征描述與所述第i層對應的學習庫中的神經網絡權值進行前饋學習,若能區分出類別出來則給出結果,并退出該層;若不能分類,則認為所述測試類別是該層中未學習的類別;
C3、進入下一層,即第i+1層,重復進行前饋學習,若能區分出類別出來則給出結果,并退出該層;若不能分類,則認為所述測試類別是該層中未學習的類別;直至第NUM層,若在最后也沒有被識別出來,則所測試的類別不在所學習的類別當中。
6.一種基于卷積神經網絡的圖像分類裝置,其特征在于,包括:
神經網絡權值獲取模塊,用于接收輸入的多個類別的圖像樣本,對輸入的每一個類別的圖像樣本數據進行歸一化,將歸一化后的圖像樣本數據進行卷積,再采用預定的非對稱映射矩陣對卷積后的圖像樣本數據進行映射,并將映射后的圖像樣本數據進行排列得到對應的一維特征描述,根據所述一維特征描述計算出每一個類別的圖像對應的神經網絡權值;
分層模塊,用于采用分層結構對多個類別圖像的對應神經網絡權值進行分布,且每一層分布的類別數目為根據所述非對稱映射矩陣確定的最大區分類別數目,將多個類別圖像在多層中依次分布,每一層形成對應的學習庫;
分類判斷模塊,用于對輸入的測試類別圖像樣本數據進行處理得到對應的一維特征描述,將所述測試類別圖像樣本數據對應的一維特征描述與所述學習庫中的神經網絡權值進行前饋學習,從而判斷出所述測試類別是否在所學習的類別圖像中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于TCL集團股份有限公司,未經TCL集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310477564.X/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





