[發明專利]用于分類的MoCo卷積神經網絡模型檢測裝置及分類方法在審
| 申請號: | 202211654734.2 | 申請日: | 2022-12-22 |
| 公開(公告)號: | CN116206147A | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 羅相好;張萬菊;鄒朝鑫 | 申請(專利權)人: | 羅相好 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/08;G06N3/0464 |
| 代理公司: | 北京華科知信專利代理事務所(普通合伙) 16086 | 代理人: | 李方帆 |
| 地址: | 551700 貴州省*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 分類 moco 卷積 神經網絡 模型 檢測 裝置 方法 | ||
本發明提供用于分類的MoCo卷積神經網絡模型檢測裝置及分類方法,涉及卷神經網絡技術領域。該用于分類的MoCo卷積神經網絡模型檢測裝置,包括圖像采集器、代理任務和訓練好的MoCo卷積神經網絡,所述圖像采集器采集分類任務中所需要的學習類型圖片,并將采集到的圖片進行圖像增強和正負樣本圖片的劃分,所述正負樣本圖片輸入到MoCo卷積神經網絡中進行特征提取,獲得正負樣本的特征向量,所述代理任務通過比較正負樣本特征向量之間的差異性指導MoCo卷積神經網絡訓練和更新,并把舊的模型替換掉,直到訓練結束。通過與使用ResNet,VGG等作為MoCo卷積神經網絡模型的特征提取模型相比,本發明采用DResNet可以在不增加計算量的前提下,促使MoCo的精度更高。
技術領域
本發明涉及卷神經網絡技術領域,具體為用于分類的MoCo卷積神經網絡模型檢測裝置及分類方法。
背景技術
圖像分類技術在20世紀40年代就已提出,但由于技術迭代不夠,計算機軟硬件設備計算能力過于單薄,圖像分類技術一直處于緩慢發展狀態,實際生產活動中難以落地,隨著計算機軟硬件的快速發展,計算能力的不斷提高,2021年imageNet冠軍Al?ex提出了AlexNet網絡將在深度學習帶入了人們的視野,而深度學習的核心卷積神經網絡更是在圖像領域掀起一波熱潮,卷積神經網絡是深度學習(Deep?Learn?i?ng)的重要算法之一,在后續十年中,神經網絡蓬勃發展,應用領域不斷擴大,目前已經成為一種強大且通用的深度學習模型,在圖像分類領域,它在多種數據集如MNIST、ImageNet上面取得了驚人效果,但隨著現階段互聯網的高度發達,越來越多的數據涌現出來,其圖片場景更為復雜,識別任務也更具挑戰性,在這種前提下,如何利用卷積神經網絡來對這些圖片進行智能分類是一個尤為重要的研究課題。
卷積神經網絡具備的網絡結構種類較多,包括了輸入層,卷積層,池化層,全連接層等,輸入層的主要作用是將輸入的圖片進行通道,尺寸等維度進行初始化,使其符合卷積神經網絡向前傳播過程中的特征圖尺寸,卷積層分布在卷積神經網絡中的每一層,用于對輸入數據進行特征提取,在卷積層內的任何一個神經元都與上一層中位置相近的神經元形成一對多的連接關系,它所連接的神經元可以稱為感受野,同時,對于不同的感受野,卷積核的參數是共享的,這種設計方式很大程度地減少了對計算資源的消耗,加快了模型收斂速度,池化層在整個網絡中的作用是逐步減小數據的空間大小,目的是減少網絡中的參數數量以及降低計算復雜度,以便很好地控制過擬合,全連接層在整個網絡中的作用是連接之前的卷積層、池化層等進行的多種操作的特征,最后把輸出的值分配給一個分類器。
現階段用于圖像分類的神經網絡模型主要有Al?exNet,VGGNet,GoogLeNet,ResNet等優秀的框架,他們在圖像分類是都有著很高的分類正確率,Al?exNet是最早的卷積神經網絡,它由5個卷積層和3個全連接層組成,激活函數采用了ReLU,提出了Dropout方法,解決了過深的卷積神經網絡梯度彌散的問題,VGGNet使用的是較小的卷積核(3×3)并采用堆疊的方式,可以減少參數的數量,同時增加了卷積神經網絡的深度,證實了加深網絡結構可以提高分類的精度和性能,GooGLeNet網絡引入了I?ncept?i?on模塊,利用這個模塊增加網絡結構的深度,進而提高效率和準確率,該模塊1×1卷積的關鍵作用:主要用于降維,抵消計算瓶頸,否則我們的網絡規模將受到限制,在增加網絡深度的前提下還可以增加網絡的寬度,并且保持性能不會有損失,ResNet是更深層次的網絡模型,在ILSVRC2015中斬獲第一名,它利用殘差學習框架對網絡的一些訓練進行簡化,證實這些殘差網絡更容易優化,而且在大幅度增加深度的同時還可以保持有效的精度,ResNet卷積神經網絡高達152層,復雜度低于VGG網絡,在圖像分類領域中取得了較好的成果,考慮到梯度消失的問題會成為一些障礙,采用殘差模塊來解決退化問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅相好,未經羅相好許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211654734.2/2.html,轉載請聲明來源鉆瓜專利網。





