[發明專利]基于多尺度融合輕量化深度學習卷積網絡的目標檢測方法在審
| 申請號: | 202111068517.0 | 申請日: | 2021-09-13 |
| 公開(公告)號: | CN113902971A | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 曾大治;梁若飛;章菲菲;劉英杰 | 申請(專利權)人: | 北京理工雷科電子信息技術有限公司 |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06V10/82;G06V30/18;G06N3/04;G06N3/08 |
| 代理公司: | 北京理工大學專利中心 11120 | 代理人: | 田亞琪 |
| 地址: | 100081 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 尺度 融合 量化 深度 學習 卷積 網絡 目標 檢測 方法 | ||
本發明公開了基于多尺度融合輕量化深度學習卷積網絡的目標檢測方法,設計骨干網絡由兩個模塊組成:主干特征提取模塊和多尺度融合定位特征模塊;主干特征提取模塊遵循了DenseNet網絡沿通道維度串聯的結構特點,使得每一層與它的所有后續層直接連接,特征可重復利用,不需要學習冗余的特征,從而降低參數量,保持網絡精簡高效;并且在其基礎上增加了雙路卷積通道方式,從而得到不同尺度的感受野;多尺度特征模塊沿用了SSD多尺度錨點框檢測機制,并在其基礎上加入3?way殘差模塊,把多尺度特征進行融合,增強特征的表達能力,從而檢測多尺度飛機目標。
技術領域
本發明屬于機器學習及深度學習的技術領域,具體涉及一種基于多尺度融合的輕量化深度學習卷積網絡的目標檢測方法。
背景技術
通常,深度神經網絡的參數數目可以達到千萬甚至億級,隨著網絡的深度和廣度的增加,網絡模型存在著大量的冗余參數,這是導致深度學習模型計算量大、內存消耗嚴重的主要原因。實際上,在網絡傳播過程中,只需要保留重要程度較高的神經元或者以更為優化和簡單的方式組織表示神經元就可以提供足夠的特征信息給神經網絡的輸出層進行結果預測。針對這個現象,很多關于模型壓縮和模型運算加速的方法被提出,總結為,深度神經網絡模型加速和優化的策略研究主要可以歸結為三個層面:精簡權重的表示方式、減少網絡連接和神經元冗余、網絡結構的優化。
(1)精簡網絡權重的表示
常用的神經網絡模型參數的表示形式都是浮點型(單精度)數或者雙精度數,即一個參數需要占用4個字節(32位)或者8個字節(64位)。為了降低深層神經網絡模型的存儲空間和內存消耗從而達到壓縮和加速深度模型的目的,很多相關研究學者企圖通過利用更少的比特位來近似表示深度神經網絡模型的實數權重值。
(2)降低網絡權重的冗余
深度神經網絡模型在參數學習的過程中其實大部分的參數對輸入對象的特征抽取影響微乎其微或者用少量的神經元即可以達到分類器對特征抽取的要求。因此,對深度神經網絡模型網絡層與層之間連接和神經元冗余問題的相關研究進展也是降低深度神經網絡模型對內存大小和計算量需求的另一個切入點。
(3)優化網絡結構
不同的神經網絡結構對模型性能的影響非常顯著,更好的網絡結構可以減少每一層的神經元和權重的數量,從而可以在保證不會出現梯度消失等問題的同時設計更深層的神經網絡模型。此外,更優化的網絡結構還可以讓網絡更加容易訓練,減少網絡模型的運算量和學習參數,達到加速神經網絡訓練和推斷過程的目的。
不難發現,深度神經網絡模型如果具有更小和更少的神經元往往意味著更低的計算量需求。因此探索更合適的神經網絡結構也可以顯著地加速網絡的訓練和推斷過程。以2014年ImageNet競賽為例子,獲得優勝的VGG模型和GoogLeNet模型在圖片分類任務中取得了相近的成績,但是GoogLeNet不僅運行速度明顯快于VGG,而且模型參數的數量也遠遠小于VGG。出現這種情況的主要原因是GoogLeNet使用了更多的小尺寸卷積核和池化操作,即在兩種網絡的神經元個數相同的情況下,GoogLeNet的權重矩陣和卷積操作的計算量也明顯小于VGG。在過去幾年中,不少相關研究提出新的神經網絡結構單元,企圖通過利用更小或者更簡單的神經單元構造網絡,以此來減少訓練參數的數量。2015年,Srivastava等人受到長短期記憶循環網絡結構的啟發,設計出了公路神經網絡。相比在此之前提出的教師網絡,具有更深網絡結構的公路網絡不僅克服梯度消失的問題,而且它僅僅用了1.25M的參數就在CIFAR-10和CIFAR-100數據集上取得了更好的表現。同年,Kaiming He等人設計了一種新的結構單元來構建深層神經網絡,稱為殘差塊。他們提出的ResNets網絡最終獲得了2015年ImageNet比賽的優勝。與公路網絡相比,ResNets網絡僅僅使用1/3的學習參數就獲得了更好的性能表現。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工雷科電子信息技術有限公司,未經北京理工雷科電子信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111068517.0/2.html,轉載請聲明來源鉆瓜專利網。





