[發明專利]基于卷積神經網絡的圖像分類改進方法有效
| 申請號: | 201910624323.0 | 申請日: | 2019-07-11 |
| 公開(公告)號: | CN110321967B | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 李躍輝;趙誠誠 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 王路 |
| 地址: | 210012 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 圖像 分類 改進 方法 | ||
本發明公開了一種基于卷積神經網絡的圖像分類的改進算法,采用AlexNet網絡模型為基本框架,將輸入圖片先進行適當預處理及數據增強,以降低對網絡對樣本數量的依賴性,通過神經網絡卷積層進行特征提取,再通過池化層保留主要特征,同時減少下一層的的參數和計算量,采用多尺度卷積的方法,使得網絡模型不再限制輸入圖像的尺寸大小,采用LDA算法進一步對特征圖進行進一步的降維,最后得到對圖片的預測分類。本發明的基于卷積神經網絡的圖像分類改進算法可以降低網絡模型對樣本數量的依賴性,通過采用LDA算法以及采用多尺度卷積可以進一步降低參數數量,簡化計算量,并且提高圖片分類的準確率。
技術領域
本發明屬于深度學習、圖像處理領域,涉及到圖像分類識別任務在改進后的深度神經網絡技術下的應用。
背景技術
由于卷積神經網絡的輸入層可以直接處理多維數據,所以卷積神經網絡在計算機視覺領域有廣泛的應用。并且數字化不斷驅動社會的發展,數據量大小也不容往日,各種海量數據不斷出現,對于神經網絡來說是個很大的挑戰。為了加快神經網絡的學習,各種針對CNN的優化算法不斷的涌現出來。目前,對于卷積神經網絡主要是在模型的深度、寬度以及數據處理的方向進行優化。2018年,高諾等人基于LeCun等人提出的卷積神經網絡模型,針對其梯度彌散和收斂速度慢等問題,對傳統的幾種激活函數進行結合和改良,對于激活函數Sigmoid和Softplus相結合得到一種新的CNN模型,并將其應用于數字手寫體的識別。使得卷積神經網絡對于數字手寫體的識別的準確率有所提高;同時,改進后減少了網絡的訓練參數,使神經網絡結構變得更簡單,適應性更強。同年王改華等人提出一種采用無監督學習算法與卷積構造的圖像分類模型,從輸入無標簽圖像中隨機抽取大小相同的圖像塊構成數據集,進行預處理,其次,將預處理后的圖像塊通過兩次K-means聚類算法提取字典,并采用離散卷積操作提取最終圖像特征最后,采用Softmax分類器對提取的圖像特征進行分類,提高了圖像分類精度,降低訓練復雜度。總的來看,大部分的優化設計都是在網絡模型的結構處著手,通過采用不同的激活函數或者對圖像進行各種預處理操作,從而提升了神經網絡模型的速度和精確度。
為解決卷積神經網絡對輸入圖像的限制以及進一步降低訓練復雜度和加快模型收斂速度,本發明提出了一種基于改進的卷積神經網絡的圖像分類算法,使得該網絡不再限制輸入圖像的尺寸以及更好的降低網絡參數量,達到更高的準確度和速度。
發明內容
發明目的:本發明提出了一種基于卷積神經網絡的圖像分類改進方法,用以實現精準、高效快速的對圖像進行識別和分類。
技術方案:一種基于卷積神經網絡的圖像分類改進方法,具體包含如下步驟:
步驟一:對輸入圖像進行圖像增強、濾波和降噪預處理操作,以降低之后對圖像特征提取的影響;
步驟二:預處理之后得到的圖像進行卷積操作,提取圖像特征,并采用最大池化方法進行池化,提取接受域中值最大的像素點,舍棄其余像素點,得到的特征圖在尺寸降低的同時還保留了圖像的關鍵信息,減小卷積核尺寸,然后再次進行卷積池化操作,輸出更加抽象的特征圖;
步驟三:將步驟二得到的經過池化卷積操作得到的特征圖通過多個連續的卷積層進行卷積,將不同通道的特征進行充分的融合,并將該特征圖送入到金字塔池化層進行池化;
步驟四:將特征圖通過多尺度卷積層進行卷積操作,這樣就得到固定尺寸大小的特征圖;
步驟五:采用LDA方法對特征圖進行進一步的降維與分類,利用LDA進行投影,將投影后的樣本特征信息帶入到概率密度函數中計算,得到概率分布信息,輸出計算結果和預測類別。
進一步地,步驟一中,對于輸入圖像進行高斯濾波,以抑制噪聲,平滑圖像,并同時對圖像進行翻轉,對色彩、飽和以及對比度進行調整。
進一步地,步驟三中共使用了四層連續的卷積層對圖像的不同通道的特征進行充分融合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910624323.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種加快圖書相似性分析速度的方法
- 下一篇:一種超聲圖像分類裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





