[發(fā)明專利]圖像分類方法、裝置和計(jì)算機(jī)設(shè)備有效
| 申請?zhí)枺?/td> | 202110339588.3 | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN113033675B | 公開(公告)日: | 2022-07-01 |
| 發(fā)明(設(shè)計(jì))人: | 鄧澤林;秦平越 | 申請(專利權(quán))人: | 長沙理工大學(xué) |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 長沙國科天河知識產(chǎn)權(quán)代理有限公司 43225 | 代理人: | 邱軼 |
| 地址: | 410000 湖南省*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 分類 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
本申請涉及一種圖像分類方法、裝置和計(jì)算機(jī)設(shè)備。所述方法包括:獲取圖像樣本,通過第一池化層對經(jīng)過卷積后的特征圖中的每個(gè)池化框進(jìn)行k次最小池化,對k個(gè)最小值取平均值得到最小池化平均值;通過第二池化層對圖像樣本進(jìn)行平均池化,得到平均池化特征圖;根據(jù)預(yù)先設(shè)置的權(quán)重,對平均池化特征圖進(jìn)行加權(quán),得到每個(gè)池化框?qū)?yīng)的極端門限值;若最小池化平均值小于極端門限值,則舍棄池化框中的最小值后進(jìn)行平均池化,得到圖像樣本對應(yīng)的去極端特征圖;利用去極端特征圖訓(xùn)練圖像分類模型,得到訓(xùn)練好的圖像分類模型;獲取待分類圖像的去極端特征圖,將去極端特征圖輸入訓(xùn)練好的圖像分類模型,得到圖像類別。采用本方法能夠提高圖像分類的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請涉及圖像處理技術(shù)領(lǐng)域,特別是涉及一種圖像分類方法、裝置和計(jì)算機(jī)設(shè)備。
背景技術(shù)
在對圖像進(jìn)行分類時(shí),通常是通過卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,在卷積神經(jīng)網(wǎng)絡(luò)中,首先對圖像進(jìn)行池化操作,最常見的池化方法是最大池化和平均池化。最大池化只保留池化框中的最大值,因而最大池化可以有效提取出特征圖中最具代表性的信息。平均池化是通過計(jì)算出池化框中所有值的均值,因而可以平均獲取特征圖中的所有信息,不致丟失過多關(guān)鍵信息。這兩種方法由于計(jì)算簡單、效果較好且能解決減少參數(shù)、降低維度等問題,因而在以往的深度神經(jīng)網(wǎng)絡(luò)模型中被廣泛使用,但這兩種方法的缺點(diǎn)也是不可忽視的。最大池化由于完全忽略了特征圖中除了最大值以外的其他特征值,這往往導(dǎo)致保留了特征圖中的前景信息而忽略了所有的背景信息;而平均池化由于取得了所有池化框中特征值之和的均值,雖然對特征圖中的背景信息有所保留,但是沒有將特征圖中的前景信息和背景信息有效地區(qū)分開。
隨著深度神經(jīng)網(wǎng)絡(luò)模型的不斷優(yōu)化,國內(nèi)外有許多新的池化方法相繼被提出。其中大部分是通過改變傳統(tǒng)池化方法的計(jì)算方式以適應(yīng)他們的網(wǎng)絡(luò)模型,少部分將最大池化和平均池化以不同形式結(jié)合,這些池化方法在目標(biāo)檢測、圖像識別等領(lǐng)域均有較好的運(yùn)用。這些新的方法被分為池化框大小固定的池化方法和池化框大小不固定的池化方法。池化框大小固定的池化方法又分為序相關(guān)和序無關(guān)的兩類。序無關(guān)的池化方法又分為確定性池化方法和隨機(jī)性池化方法。這些新的池化方法運(yùn)用在不同的數(shù)據(jù)集上均較傳統(tǒng)池化方法在精度、錯(cuò)誤率和魯棒性等關(guān)鍵數(shù)據(jù)下獲得較大提升。雖然池化方法的更新彌補(bǔ)了很多缺陷,在實(shí)際應(yīng)用過程中取得了不錯(cuò)的效果,但是,池化層要面對的問題還有很多。如,在以往平均池化的方法中,通過對池化框中的特征值進(jìn)行取平均得到最后的特征值,在這中的平均池化操作下,雖然大部分特征值出現(xiàn)在平均曲線較近的位置,但在特征圖中較小的值占有較大的比重的情況下,較小的特征值會將整個(gè)池化框進(jìn)行平均池化后的特征平均值拉低,造成最終平均值太小的情況,特征的代表性被弱化。在對于平均池化層出現(xiàn)兩極相差較大的情況沒有得到有效的解決,在以往的卷積神經(jīng)網(wǎng)絡(luò)的分類任務(wù)中,在模型適應(yīng)平均池化的情況下,特征圖中的某些特征值極度遠(yuǎn)離平均值的情況時(shí)有出現(xiàn),雖然這類特征值是背景信息中的一部分,但平均池化操作是在當(dāng)特征中的信息都具有一定貢獻(xiàn)的前提下使用,這顯然與平均池化操作的初衷相違背。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠決平均池化時(shí)存在背景信息過小會導(dǎo)致圖像分類準(zhǔn)確性下降問題的圖像分類方法、裝置和計(jì)算機(jī)設(shè)備。
一種圖像分類方法,所述方法包括:
獲取圖像樣本,通過第一池化層對所述圖像樣本中每個(gè)池化框中的數(shù)據(jù)進(jìn)行k次最小池化,得到k個(gè)最小池化特征值,取平均值得到最小池化平均值;其中k為池化框維度;
通過第二池化層對所述圖像樣本進(jìn)行平均池化,得到平均池化特征圖;其中,第二池化層是對池化框中的數(shù)據(jù)計(jì)算平均值;
根據(jù)預(yù)先設(shè)置的權(quán)重,對所述平均池化特征圖進(jìn)行加權(quán),得到每個(gè)池化框?qū)?yīng)的極端門限值;
若所述最小池化平均值小于所述極端門限值,則舍棄所述池化框中的最小值后進(jìn)行平均池化,得到圖像樣本對應(yīng)的去極端特征圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于長沙理工大學(xué),未經(jīng)長沙理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110339588.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





