[發明專利]一種基于全卷積分裂網絡的目標檢測方法有效
| 申請號: | 201710616541.0 | 申請日: | 2017-07-26 |
| 公開(公告)號: | CN107392214B | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 李宏亮 | 申請(專利權)人: | 成都快眼科技有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06N3/04 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 郭彩紅 |
| 地址: | 610200 四川省成都市雙*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 分裂 網絡 目標 檢測 方法 | ||
本發明提供了一種基于全卷積分裂網絡的目標檢測方法,對圖片進行預處理:將搜集到的數據集中的圖片進行隨機抽取裁剪,具體剪裁方法為:取圖片長寬的設定大小的預置框,在圖片中選取5處裁剪預置框大小的圖片,分別為圖片的四角和中心位置,將對應目標的目標框映射到處理后的圖片,得到訓練圖片。與現有技術相比,在計算資源損耗方面是當前網絡模型(比如VGG網絡)的1/100;在運算時間方面提速了300倍,極大提升了運算效率;在檢測性能方面,本方法能有效檢測到道路上出現的大小目標,達到了速度與精度的平衡。
技術領域
本發明涉及一種計算機視覺目標檢測領域,特別是涉及一種適用于基于全卷積分裂網絡的目標檢測方法。
背景技術
視覺是人類獲取信息的主要方式,人類獲取的信息有70%來自視覺信息。隨著社會的發展,智能感知傳感器的分布越來越廣泛,我們可以從這些傳感器中獲得大量的信息。人類可以從復雜的環境中準確的定位和檢測到物體,這是人類視覺的基本的功能。計算機視覺中的目標檢測,旨在利用計算機對自然圖片中的目標進行檢測和定位,是目標跟蹤和大量后續工作的基礎。具有極其重要的研究價值。在學術界和工業界,研究目標檢測的算法是十分重要的,但是在計算機視覺領域,現有的目標檢測算法仍然存在著十分重要的缺陷。比如,無法滿足實時性,算法運行時資源消耗巨大。
隨著卷積神經網絡的發展,基于卷積神經網絡的分類方法在圖像分類問題上面有著優異的表現,現有19層的VGG網絡將1000類的分類挑戰的精度突破到了7.3%;22層的GoogleNet網絡將分類精度突破到了6.7%.到了2015年,由何凱明發明的152層殘差網絡將分類誤差降低到了3.57%.然而隨著網絡的不斷深入發展,卷積神經網絡的深度在不斷提升,與此同時網絡的大小也在不斷的增大。網絡越大,所消耗的計算資源越多,計算的時間復雜度也就越大,然而現有的計算資源是十分有限的。于是深度網絡的大規模運用就收到了局限。
基于深度學習的目標檢測算法主要的框架主要是利用卷積神經網絡作為特征提取的模塊,然后利用深度特征進行目標的檢測。現有主流的基于深度學習的目標檢測算法分為兩大類,一類是以候選區域(region proposal)算法為主要框架的R-CNN系列,分別包括(R-cnn, fast R-cnn, faster R-cnn);另一類是以預置框(anchor box)為主要框架的YOLO和SSD兩個方法。兩類方法都得益于卷積神經網絡的優異的特征提取的能力。但是由于特征提取的部件所消耗的計算資源十分巨大。于是現有的基于深度學習的目標檢測算法在實時性方面依然差強人意。
隨著計算資源的分散化,視覺方面的計算移動化越來越成為趨勢,人們更多的希望可以在移動端使用目標檢測的功能。這就給基于深度學習的目標檢測算法待來了極大的挑戰。因為現有比較優秀的檢測框架和算法根本無法在超小計算能力的平臺上運行。于是,在保證檢測識別的精度的前提下,提高實時性成為了我們這個專利的研究方向。
發明內容
本發明要解決的技術問題是克服現有基于深度學習的目標檢測算法技術的復雜度過高的不足,提供一種基于全卷積分裂網絡的目標檢測方法,在保證檢測識別的精度的前提下,提高目標檢測的實時性。
本發明采用的技術方案如下:一種基于全卷積分裂網絡的目標檢測方法,具體方法包括:
對圖片進行預處理:將搜集到的數據集中的圖片進行隨機抽取裁剪,具體剪裁方法為:取圖片長寬的設定大小的預置框,在圖片中選取5處裁剪預置框大小的圖片,分別為圖片的四角和中心位置,將對應目標的目標框映射到處理后的圖片,得到訓練圖片;
特征提取階段特征提取部分的特征提取網絡結構為:特提取網絡的層數為9層卷積層;其中,有n層卷積層后級聯一個用于降采樣的池化層;兩個濾波器的輸出大小分別為1x1(單位:像素)和3x3(單位:像素);其中,n為大于等于1小于等于9的自然數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都快眼科技有限公司,未經成都快眼科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710616541.0/2.html,轉載請聲明來源鉆瓜專利網。





