[發明專利]一種對圖像進行分類的圖像處理方法和圖像處理裝置有效
| 申請號: | 201410474927.9 | 申請日: | 2014-09-17 |
| 公開(公告)號: | CN105488515B | 公開(公告)日: | 2019-06-25 |
| 發明(設計)人: | 吳春鵬;陳理;范偉;孫俊 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/02 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 杜誠;賈萌 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 卷積 神經 網路 分類 方法 圖像 處理 裝置 | ||
提供一種訓練卷積神經網路分類器的方法和圖像處理裝置。根據該訓練卷積神經網絡分類器的方法,從訓練用圖像中提取全局特征和局部特征。根據預定模式將全局特征和局部特征映射到特征圖以作為分類器的輸入樣本。根據預定模式,全局特征被映射到至少一個第一區域,局部特征被映射到一個第二區域,每個第一區域與第二區域相接。根據本公開的訓練方法,較大程度上提高了檢測的速度和準確度。
技術領域
本發明涉及圖像識別領域,尤其涉及一種訓練卷積神經網絡分類器的方法和用于對圖像進行分類的圖像處理裝置。
背景技術
卷積神經網絡由于結構簡單、訓練參數少和適應性強等特點,越來越普遍地應用于模式識別、圖像處理等領域。
例如,圖1是示出傳統的利用卷積神經網絡(Convolutional Neural Network,簡稱CNN)的分類器100的結構的示意圖。其由如下幾部分構成:輸入層、卷積層、空間采樣層、全連接層以及輸出層。
在利用傳統的CNN分類器進行識別的過程中,以手寫數字為例,輸入一幅圖像,經過多次重復的卷積、空間最大采樣和全連接操作后,CNN 分類器輸出在每種數字上的置信度。置信度最高的輸出就是識別結果。在圖1的示例中,輸入層輸入手寫數字“6”,而輸出層輸出在每種數字上的置信度。其在數字“6”上獲得最高的置信度0.980,因而,識別結果就是6。在圖1中,標有F0至F9的每一個方框代表一個特征圖(feature map)。為統一起見,輸入圖像也可以看成特征圖。
傳統CNN一般采用圖像像素本身作為輸入樣本進行學習。雖然采用圖像像素本身作為特征存在方便快捷的優點,但是限制了CNN在復雜視覺任務中的應用。比如要求CNN檢測一個自然場景中的所有字符。此時,若把整個圖像輸入CNN,會極大的減慢訓練速度和實際使用速度,并且會因為噪聲過多導致檢測準確度降低。
此外,傳統CNN通常采用經典梯度下降算法進行訓練。該算法根據輸出層的誤差從輸出層到輸入層逐層后向傳播調整權值。這種經典算法在相關文獻的理論研究中被證實存在“梯度消失”的問題。即,越往輸入層傳播,權值調整量就越小。這導致最應該得到調整的靠近輸入層的權值反而調整量最小,極大的減緩了整個CNN的學習速度。
此外,CNN分類器的傳統訓練方法僅關注對單個CNN的訓練過程,或是在高性能計算環境下并行訓練一批CNN。
發明內容
在下文中給出關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖確定本發明的關鍵或重要部分,也不是意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
根據本公開的一方面,提供一種訓練卷積神經網絡分類器的方法,包括:從訓練圖像中提取全局特征和局部特征;以及根據預定模式將全局特征和局部特征映射到特征圖以作為分類器的輸入樣本;其中,根據預定模式,全局特征被映射到至少一個第一區域,局部特征被映射到一個第二區域,每個第一區域與第二區域相接。
在根據本公開的一個實施例中,局部特征可以包括提取自同一區域的至少兩種局部特征,并且局部特征的映射可以包括將提取自同一區域的至少兩種局部特征映射到同一位置。
在根據本公開的另一個實施例中,根據上述預定模式,全局特征可以被映射到多個第一區域,第二區域被第一區域圍繞。
在根據本公開的另一個實施例中,至少兩種局部特征的映射可以包括點對點相加、點對點相乘、卷積神經網絡的卷積計算或其結合中的一種。
在根據本公開的另一個實施例中,該訓練方法還可以包括:以后向傳播的方式根據權重梯度來調整分類器中各層之間的有關連接的權重。其中,在調整靠近輸入層側的至少一層的連接的權重時,對權重梯度進行增強,所增強的程度可以取決于該至少一層之后的各層之間的連接的權重梯度的值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410474927.9/2.html,轉載請聲明來源鉆瓜專利網。





