[發明專利]基于混合深度可分離膨脹卷積的圖像分類模型及其分類方法有效
| 申請號: | 202011032957.6 | 申請日: | 2020-09-27 |
| 公開(公告)號: | CN112258431B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 閆超;黃俊潔;陶陶 | 申請(專利權)人: | 成都東方天呈智能科技有限公司 |
| 主分類號: | G06T5/30 | 分類號: | G06T5/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都佳劃信知識產權代理有限公司 51266 | 代理人: | 幸偉山 |
| 地址: | 610000 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 混合 深度 可分離 膨脹 卷積 圖像 分類 模型 及其 方法 | ||
本發明公開了一種基于混合深度可分離膨脹卷積的圖像分類模型,構建過程包括:從前至后將深度可分離膨脹卷積層、特征連接層、卷積層、批標準化層和修正線性單元層封裝成混合深度可分離膨脹卷積模塊;從前至后將卷積層、批量歸一化層、修正線性單元層、混合深度可分離膨脹卷積模塊、最大值池化層、壓平層、隨機失活層和全連接層封裝構成深度神經網絡的主干網絡;對主干網絡的參數權重進行隨機初始化,并預設迭代次數和批量歸一化層的動量參數;采用隨機梯度下降法優化網絡模型的參數,重復迭代計算,直至損失值收斂,得到最優的網絡模型。通過上述方案,本發明具有架構簡單、計算工作量少、分類精準等優點。
技術領域
本發明涉及圖像處理技術領域,尤其是基于混合深度可分離膨脹卷積的圖像分類模型及其分類方法。
背景技術
圖像是可以客觀地展示自然事物,是人們認知世界的重要資源,而且技術人員可以通過分析圖像獲得有益的信息,發展相關算法。圖像分類屬于計算機視覺方向,在醫療、食品安全等領域廣泛應用。
目前,現有技術中的圖像分類算法主要思想就是給需要分類的圖像集合分配對應的標簽,對于計算機來說,一張圖像就是一個像素矩陣,其利用相關算法技術提取像素矩陣中有效的信息,這與人對圖像的認知方式不同。傳統圖像分類算法主要分為手工特征提取、特征編碼、分類器分類這三步驟;其中,常用的手工特征有局部二值化模式特征(LocalBinary Pattern,LBP)、尺度不變特征變換(Scale-Invariant Feature Transform,SIFT)以及方向梯度直方圖特征(Histogram of Oriented Gradient,HOG)等。特征編碼是為了去除冗余的特征信息,提高表征信息的魯棒性。通用的分類器有支持向量機(Support VectorMachine,SVM)和自適應增強分類器(Adaptive Boosting,AdaBoost)等。由于手工特征泛化性差,從而影響到傳統圖像分類算法在實際場景中的應用,在精度和速度上都沒有多大的優勢。隨著計算機算力的提升,深度學習算法得到了迅速的發展,深度學習的圖像分類算法也因此開始崛起。
2012年Alex Krizhevsky等人提出了Alexnet網絡結構,對ImageNet數據集進行學習,取得了2012年ImageNet比賽的冠軍,從此之后不斷出現深度學習算法應用到大數據圖像分類上。深度學習的圖像分類算法通過利用卷積神經網絡提取樣本的卷積特征,具有更加豐富的語義信息,能讓算法模型學習到更加高效的表達能力,與手工特征相比,更為精準。但是,深度學習算法的圖像分類算法在訓練網絡模型時,為了減少特征維度,都會添加特征下采樣操作,一定程度上避免網絡出現過擬合現象,如池化層,這樣會造成卷積特征丟失細節信息。Jonathan Long等人提出全卷積網絡結構,其中,使用反卷積層增大特征圖的分辨率,一定程度上恢復些細節信息但較為粗糙。同年,Kaiming He等人提出殘差深度神經網絡,采用跳躍連接結構將深層網絡層特征和淺層網絡層特征融合,提升特征圖中細節信息的使用率。
現有技術中的深度學習的圖像分類算法中采用池化層或步長為2的卷積層對特征圖像進行下采樣操作,減少數量,擴大感受野,增加特征圖的語義信息,但是,其會丟失特征圖的細節信息。
綜上所述,上述方法都只能一定程度上修補特征圖的細節信息,但是會增加網絡模型的參數量,使網絡模型變得復雜,難優化,所以特征圖細節信息的丟失問題還是影響著分類檢測精度。
另外,在專利申請號為“201910818758.9”、名稱為“基于輕量級深度神經網絡的工業產品缺陷圖像分類方法”的中國發明專利中,其包含:1、工業產品圖像數據集的準備;2、搭建輕量級深度神經網絡;3、將工業產品缺陷圖像數據集輸入到搭建好的輕量級深度神經網絡中,經過網絡訓練,提取偏光片圖像多尺度特征,將提取到的特征輸入Softmax層進行分類,得到分類模型;4、將測試圖像輸入分類模型中,將圖像屬于某一類別的概率和圖像對應的標簽輸入到Accuracy層,輸出圖像的正確分類結果。但是,該技術存在以下缺陷:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都東方天呈智能科技有限公司,未經成都東方天呈智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011032957.6/2.html,轉載請聲明來源鉆瓜專利網。





