[發明專利]一種多尺度逐步累加的卷積神經網絡學習方法有效
| 申請號: | 201810359791.5 | 申請日: | 2018-04-20 |
| 公開(公告)號: | CN108875906B | 公開(公告)日: | 2019-06-04 |
| 發明(設計)人: | 朱建清;曾煥強;陳婧;蔡燦輝;杜永兆;吳含笑 | 申請(專利權)人: | 華僑大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 泉州市文華專利代理有限公司 35205 | 代理人: | 張浠娟 |
| 地址: | 362000 福*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 累加 多尺度 尺度 圖像 人工智能領域 多尺度圖像 機器視覺 目標分類 目標檢測 目標識別 輸入圖像 特征學習 池化 構建 學習 金字塔 送入 應用 網絡 | ||
本發明涉及一種多尺度逐步累加的卷積神經網絡學習方法,可廣泛應用于機器視覺和人工智能領域,例如目標檢測、目標分類、目標識別等。首先,本發明采用均值池化操作對輸入圖像構建多尺度圖像金字塔;然后,將各個不同尺度的圖像逐步送入卷積神經網絡,讓卷積神經網絡隨著網絡深度的逐步深入,能夠在多種不同尺度的圖像上進行學習并進行特征逐步累加,從提高了而卷積神經網絡的特征學習能力。
技術領域
本發明涉及機器視覺和人工智能領域,特別涉及一種多尺度逐步累加的卷積神經網絡學習方法,可應用于目標檢測、目標分類和目標識別系統。
背景技術
卷積神經網絡是目前最流行的一種深度學習算法。近年來涌現出大量基于卷積神經網絡的目標檢測、目標分類和目標識別算法,這些算法的準確性很大程度上依賴于卷積神經網絡特征學習能力。
對卷積神經網絡的研究,目前多數聚焦于通過加深網絡深度來提升特征學習能力,出現了很多極深的卷積神經網絡,例如GoogleNet,ResNet,DenseNet等。這些極深的卷積神經網絡確實提升了卷積神經網絡的特征學習能力,但是其相應的計算量也急劇增長。此外,不管網絡的深度如何,這些極深的卷積神經網絡都是將最后的特征映射(FeatureMap)作為最終的圖像特征表達,意味著只有單一尺度的特征被學習得到,因此卷積神經網絡的特征學習能力依然具有一定的提升空間。
除了上述極深的卷積神經網絡之外,亦有少數多尺度卷積神經網絡被提出來。文獻[1](P.Sermanet and Y.LeCun.Traffic sign recognition with multi-scaleconvolutional networks[C].The 2011International Joint Conference on NeuralNetworks,San Jose,CA,2011,pp.2809-2813)將不同深度的下采樣池化(Pooling)層輸出的特征映射進行線性組合獲得最終的多尺度融合特征??梢?,文獻[1]的這種做法并不是在一個多尺度的圖像金字塔中學習多尺度特征。文獻[2](J.Liu,Z.J.Zha,and Q.I.Tian,etal.Multi-scale triplet CNN for person re-identification[C].ACM on MultimediaConference,Theater Tuschinski,Amsterdam,2016,pp.192-196)首先使用不同的下采樣率,獲得一系列分辨率不同的輸入圖像;其次,在高分辨率的圖像上訓練深的卷積神經網絡,而在低分辨率圖像上訓練淺的卷積神經網絡;最后,把多個深淺不一的卷積神經網絡的最后一層輸出的特征映射全部串聯起來,獲得最終的多尺度融合特征。可見,文獻[2]的算法未能把圖像下采樣操作整合到卷積神經網絡的學習中,且它實際上需要訓練同時多個卷積神經網絡,計算量偏大。
發明內容
本發明的目的在于提供一種多尺度逐步累加的卷積神經網絡學習方法,該方法具有能夠融合多種不同尺度的特征的能力,可提升卷積神經網絡的特征學習能力。
為實現上述目的,本發明采用的技術方案是:
一種多尺度逐步累加的卷積神經網絡學習方法,其具體包括以下步驟:
步驟1、構建多尺度圖像金字塔;
輸入圖像作為第一個尺度圖像,將輸入圖像通過低通濾波器濾除噪聲,并利用下采樣操作得到分辨率更低的第二個尺度圖像;然后在第二個尺度圖像上繼續進行低通濾波和下采樣操作,得到第三個尺度圖像;如此重復,最終構建出具有N個尺度圖像的多尺度圖像金字塔,其中,N≥2;
步驟2、逐步累加的多尺度特征學習;
把步驟1中的構建多尺度圖像金字塔中各個不同尺度的圖像逐步送入卷積神經網絡,使得在不同尺度的圖像上學習的特征隨著網絡深度的深入逐步累加,最終獲得圖像的多尺度特征表達,具體如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華僑大學,未經華僑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810359791.5/2.html,轉載請聲明來源鉆瓜專利網。





