[發明專利]圖像分類卷積神經網絡結構的構建方法有效
| 申請號: | 201710106457.4 | 申請日: | 2017-02-27 |
| 公開(公告)號: | CN106874956B | 公開(公告)日: | 2018-10-23 |
| 發明(設計)人: | 馬苗;劉琳;武杰;陳昱蒞;裴炤 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 西安永生專利代理有限責任公司 61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 卷積 神經網絡 結構 構建 方法 | ||
一種圖像分類卷積神經網絡結構的構建方法,由構建卷積神經網絡結構、卷積神經網絡訓練和測試步驟組成。構建卷積神經網絡結構的步驟為:獲得訓練樣本圖像和測試樣本圖像并對其進行預處理、設定卷積神經網絡初始結構、引入激活函數、確定池化方法、確定濾波器、確定卷積層個數,得到圖像分類卷積神經網絡結構;卷積神經網絡的訓練和測試步驟為:用K?Means聚類方法獲得含有20個特征圖的卷積層的濾波器,經前向傳播和反向傳播更新網絡權值矩陣至最大訓練次數,得到訓練好的卷積神經網絡,對測試樣本圖像進行測試,得到驗證后的圖像分類卷積神經網絡結構,具有構建方法簡單、有效等優點,適用于門牌號碼、手寫數字、郵政編碼等圖像分類。
技術領域
本發明屬于圖像處理及模式識別技術領域,具體涉及到適用于圖像分類的卷積神經網絡結構。
背景技術
深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經網絡。它通過模仿人腦的機制來解釋數據,例如圖像、聲音和文本,其核心是通過構建具有多個隱層的機器學習模型和大量的訓練數據,來學習更有用的特征,從而最終提升分類或預測的準確性。
現有的LeNet-5、AlexNet、GoogLeNet、ResNet等代表性網絡都是基于卷積神經網絡結構。其中,LeNet-5由7層組成,其1、3、5層為卷積層,2、4層為池化層;AlexNet由8層組成,其前5層是卷積層,后3層是全連接層;GoogLeNet由22層組成,其中有21個卷積層,1個全連接層;ResNet由152層組成,其中有151個卷積層,最后一層為全連接層。這些網絡模型都是在卷積神經網絡模型的基礎上,通過加深網絡深度完成對網絡模型的改進。此外,還有人提出將卷積神經網絡學習算法與其它思想或方法相結合,如隱馬爾科夫模型(HiddenMarkov Model,HMM)與CNN相結合的混合模型,快速PCA和CNN相結合的模型等。
上述基于神經網絡在圖像分類方法中所存在的主要技術問題是網絡結構設計過程中,關于濾波器個數和大小、池化方法、激活函數往往是依賴經驗確定,不恰當的網絡結構會極大地增加網絡參數個數,導致網絡計算復雜度增加。
發明內容
本發明所要解決的技術問題在于克服現有技術的缺點,提供一種結構簡單、易實現、收斂速度快的圖像分類卷積神經網絡結構的構建方法。
解決上述技術問題所采用的技術方案是由構建卷積神經網絡結構、卷積神經網絡訓練和測試步驟組成,所述的構建卷積神經網絡結構步驟如下:
(1)獲得訓練樣本圖像和測試樣本圖像并對其進行預處理
(a)從圖像數據集中選取50400~73257張訓練樣本圖像和6000~26032張測試樣本圖像;
(b)對50400~73257張訓練樣本圖像進行預處理
包括圖像灰度化、圖像減均值步驟:
圖像灰度化:用(1)式對被訓練的樣本圖像進行灰度化處理,將彩色圖像轉為灰度圖像:
I=W1×R+W2×G+W3×B (1)
式中I為灰度化后的圖像,R為彩色圖像的紅色分量,G為彩色圖像的綠色分量,B為彩色圖像的藍色分量,W1為彩色圖像的紅色分量的權重,W2為彩色圖像的綠色分量的權重,W3為彩色圖像的藍色分量的權重。
圖像減均值:用(2)式對已被灰度化的訓練樣本圖像進行減均值處理:
式中Z為減均值后的圖像,vi為n個圖像中的第i個圖像的像素矩陣,n為50400~73257整數個圖像。
(c)對6000~26032張測試樣本圖像進行預處理
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710106457.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





