[發明專利]圖像分類卷積神經網絡結構的構建方法有效
| 申請號: | 201710106457.4 | 申請日: | 2017-02-27 |
| 公開(公告)號: | CN106874956B | 公開(公告)日: | 2018-10-23 |
| 發明(設計)人: | 馬苗;劉琳;武杰;陳昱蒞;裴炤 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 西安永生專利代理有限責任公司 61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 卷積 神經網絡 結構 構建 方法 | ||
1.一種圖像分類卷積神經網絡結構的構建方法,由構建卷積神經網絡結構、卷積神經網絡訓練和測試步驟組成,其特征在于所述的構建卷積神經網絡結構步驟如下:
(1)獲得訓練樣本圖像和測試樣本圖像并對其進行預處理
(a)從圖像數據集中選取50400~73257張訓練樣本圖像和6000~26032張測試樣本圖像;
(b)對50400~73257張訓練樣本圖像進行預處理
包括圖像灰度化、圖像減均值步驟:
圖像灰度化:用(1)式對被訓練的樣本圖像進行灰度化處理,將彩色圖像轉為灰度圖像:
I=W1×R+W2×G+W3×B (1)
式中I為灰度化后的圖像,R為彩色圖像的紅色分量,G為彩色圖像的綠色分量,B為彩色圖像的藍色分量,W1為彩色圖像的紅色分量的權重,W2為彩色圖像的綠色分量的權重,W3為彩色圖像的藍色分量的權重;
圖像減均值:用(2)式對已被灰度化的訓練樣本圖像進行減均值處理:
式中Z為減均值后的圖像,vi為n個圖像中的第i個圖像的像素矩陣,n為50400~73257整數個圖像;
(c)對6000~26032張測試樣本圖像進行預處理
測試樣本圖像的預處理與對訓練樣本進行預處理步驟(b)相同;
(2)設定卷積神經網絡初始結構
設定卷積神經網絡初始結構:輸入層(1)是50400~73257張大小為28×28或32×32的訓練樣本圖像,輸入層(1)后連接含有20個特征圖的卷積層(2),含有20個特征圖的卷積層(2)后連接含有20個特征圖的池化層(3),含有20個特征圖的池化層(3)后連接含有64個特征圖的卷積層(2),含有64個特征圖的卷積層(2)后連接含有64個特征圖的池化層(3),含有64個特征圖的池化層(3)后連接含有500個特征圖的卷積層(2),含有500個特征圖的卷積層(2)后連接全連接層(4),全連接層(4)后連接輸出層(5);
(3)引入激活函數
在每個卷積層(2)后引入ReLu激活函數為:
yi=max{xi,0} (3)
式中xi為與前一層輸出相連的第i個權值矩陣與當前層輸入的內積,即卷積結果,yi為第i個特征圖的輸出,20≤i≤500;
(4)確定池化方法
卷積神經網絡中的池化層(3)選用最大池化方法或均值池化方法或隨機池化方法進行池化;
(5)確定濾波器
在3×3~9×9方陣之間、以圖像寬度28或32為步長,在20~500內進行網格搜索,得到濾波器,為卷積層(2)的權值矩陣,濾波器的大小在3×3~9×9方陣之間,個數在20~500之間;
(6)確定卷積層(2)個數
在含有20個特征圖的池化層(3)后增加一層卷積層(2),其濾波器大小和個數與含有20個特征圖的卷積層(2)的濾波器大小和個數相同,通過式(4)得到該卷積層(2)特征圖的大小,在含有64個特征圖的池化層(3)后增加或不增加一層卷積層(2),若增加一層卷積層,其濾波器大小和個數與含有64個特征圖的卷積層(2)的濾波器大小和個數相同,通過式(4)得到該卷積層(2)特征圖的大小,卷積層(2)個數為3~5層,選擇使得卷積神經網絡對所選測試樣本圖像6000~26032張分類效果最好時的卷積層(2)個數,得到圖像分類卷積神經網絡結構:
o=I*-m+1 (4)
式中I*為本層輸入矩陣的長,m為濾波器的像素矩陣長,o為卷積層(2)特征圖的像素矩陣長;
所述的卷積神經網絡的訓練和測試步驟為:
(1)用K-Means聚類方法獲得含有20個特征圖的卷積層(2)的權值矩陣
(a)從訓練集中隨機選取N個m×m矩陣大小的圖像塊,N為所選取圖像塊有限的正整數,m為含有20個特征圖的卷積層(2)的濾波器的像素矩陣長,m為3~9;
(b)用式(5)對步驟(a)中所選取的N個圖像塊中的每一個圖像塊進行歸一化處理:
式中x*為m×m矩陣大小的圖像塊,μ為N個圖像塊的平均值,σ為N個圖像塊的標準差,x表示經過歸一化后的結果;
(c)以式(6)為目標函數,對上步得到的圖像塊進行10次K-Means聚類方法,取其中目標函數值最小的一次所得到的20個聚類中心,作為含有20個特征圖的卷積層(2)的濾波器初始化值:
式中k為20是聚類個數,s表示圖像塊的類別數,xj為第i類別中的圖像塊,為第i類的樣本均值,i為1~20的整數;
(2)將預處理后的50400~73257張訓練樣本圖像輸入圖像分類卷積神經網絡結構,經過前向傳播和反向傳播兩個步驟反復循環更新網絡的權值矩陣,直至達到30~70次數,訓練過程結束,得到訓練好的卷積神經網絡;
(3)將預處理后的6000~26032張測試樣本圖像輸入到訓練好的卷積神經網絡進行測試,得到驗證后的圖像分類卷積神經網絡結構。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710106457.4/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





