[發(fā)明專利]增強(qiáng)圖像分類模型噪聲魯棒性的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201910296090.6 | 申請(qǐng)日: | 2019-04-12 |
| 公開(公告)號(hào): | CN110070505A | 公開(公告)日: | 2019-07-30 |
| 發(fā)明(設(shè)計(jì))人: | 趙俊杰 | 申請(qǐng)(專利權(quán))人: | 北京邁格威科技有限公司 |
| 主分類號(hào): | G06T5/00 | 分類號(hào): | G06T5/00;G06K9/62 |
| 代理公司: | 北京鉦霖知識(shí)產(chǎn)權(quán)代理有限公司 11722 | 代理人: | 李志新;李靜波 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 噪聲圖 分類模型 增強(qiáng)圖像 魯棒性 噪聲 噪聲魯棒性 圖像分類模型 方法和裝置 特征提取步驟 損失計(jì)算 特征提取 | ||
本發(fā)明提供了一種增強(qiáng)圖像分類模型噪聲魯棒性的方法和裝置。其中,增強(qiáng)圖像分類模型噪聲魯棒性的方法包括:獲取原圖步驟,獲取原圖;獲取噪聲圖步驟,獲取在原圖基礎(chǔ)上帶有噪聲的噪聲圖;特征提取步驟,通過圖像分類模型,對(duì)原圖和噪聲圖進(jìn)行特征提取,得到原圖特征和噪聲圖特征;損失計(jì)算步驟,基于原圖特征和噪聲圖特征,計(jì)算原圖特征和噪聲圖特征之間的噪聲距離,并計(jì)算魯棒性損失;約束步驟,基于魯棒性損失,約束原圖特征與噪聲圖特征之間的噪聲距離。通過噪聲圖計(jì)算魯棒性損失,并約束原圖和帶噪聲圖特征之間的距離,能夠高效的有效增強(qiáng)圖像分類模型對(duì)噪聲的魯棒性,從而提高圖像分類模型的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明一般地涉及圖像分類領(lǐng)域,特別是涉及增強(qiáng)圖像分類模型噪聲魯棒性的方法和裝置。
背景技術(shù)
圖像分類(Image classification)是計(jì)算機(jī)視覺中一項(xiàng)非常重要的研究課題,隨著深度學(xué)習(xí)的快速發(fā)展,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolution neural networks)的圖像分類方法取得了很好的效果。
但是在圖像的獲取、傳輸過程中會(huì)有諸多因素對(duì)圖像帶來干擾,使得圖像產(chǎn)生噪聲(Noise)、質(zhì)量降低等現(xiàn)象。傳統(tǒng)的圖像分類模型對(duì)于噪聲非常敏感,例如一個(gè)貓的分類網(wǎng)絡(luò)對(duì)于是否添加噪聲的貓的圖像可以得出兩個(gè)完全相反的分類結(jié)果。由于噪聲的存在,導(dǎo)致基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類結(jié)果的準(zhǔn)確性很低。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明提供一種增強(qiáng)圖像分類模型噪聲魯棒性的方法和裝置。
第一方面,本發(fā)明提供了一種增強(qiáng)圖像分類模型噪聲魯棒性的方法,其中,包括:獲取原圖步驟,獲取原圖;獲取噪聲圖步驟,獲取在原圖基礎(chǔ)上帶有噪聲的噪聲圖;特征提取步驟,通過圖像分類模型,對(duì)原圖和噪聲圖進(jìn)行特征提取,得到原圖特征和噪聲圖特征;損失計(jì)算步驟,基于原圖特征和噪聲圖特征,計(jì)算原圖特征和噪聲圖特征之間的噪聲距離,并計(jì)算魯棒性損失;約束步驟,基于魯棒性損失,約束原圖特征與噪聲圖特征之間的噪聲距離,得到訓(xùn)練后的圖像分類模型。
在一例中,獲取噪聲圖步驟還包括,通過對(duì)原圖進(jìn)行圖像變化,得到噪聲圖。
在一例中,圖像變化采用平移、旋轉(zhuǎn)、縮放、仿射變換、高斯模糊、運(yùn)動(dòng)模糊、椒鹽噪聲中的一種或多種方式。
在一例中,損失計(jì)算步驟包括,基于原圖特征和噪聲圖特征之間的噪聲距離,選取與原圖特征之間的噪聲距離大于預(yù)設(shè)值的噪聲圖特征作為樣本特征、或通過排序選取與原圖特征之間的噪聲距離最遠(yuǎn)的一個(gè)或多個(gè)噪聲圖特征作為樣本特征,并基于樣本特征計(jì)算魯棒性損失。
在一例中,損失計(jì)算步驟還包括,根據(jù)曼哈頓距離、歐式距離、相對(duì)熵或交叉熵計(jì)算噪聲距離。
在一例中,損失計(jì)算步驟還包括,基于原圖特征和標(biāo)準(zhǔn)特征之間的標(biāo)準(zhǔn)距離,計(jì)算分類損失;約束步驟還包括,基于分類損失,約束原圖特征與標(biāo)準(zhǔn)特征之間的標(biāo)準(zhǔn)距離。
第二方面,本發(fā)明提供了一種圖像分類方法,包括圖像獲取步驟,獲取待測圖像;圖像分類步驟,通過圖像分類模型對(duì)待測圖像進(jìn)行分類,圖像分類模型經(jīng)過如第一方面的增強(qiáng)圖像分類模型噪聲魯棒性的方法訓(xùn)練。
第三方面,本發(fā)明提供了一種增強(qiáng)圖像分類模型噪聲魯棒性的裝置,包括:獲取原圖模塊,用于獲取原圖;獲取噪聲圖模塊,用于獲取在原圖基礎(chǔ)上帶有噪聲的噪聲圖;特征提取模塊,用于通過圖像分類模型,對(duì)原圖和噪聲圖進(jìn)行特征提取,得到原圖特征和噪聲圖特征;損失計(jì)算模塊,用于基于原圖特征和噪聲圖特征,計(jì)算原圖特征和噪聲圖特征之間的噪聲距離,并計(jì)算魯棒性損失;約束模塊,用于基于魯棒性損失,約束原圖特征與噪聲圖特征之間的噪聲距離,得到訓(xùn)練后的圖像分類模型。
第四方面,本發(fā)明提供了一種圖像分類裝置,包括圖像獲取模塊,用于獲取待測圖像;圖像分類模塊,用于通過圖像分類模型對(duì)待測圖像進(jìn)行分類,圖像分類模型經(jīng)過如第一方面的增強(qiáng)圖像分類模型噪聲魯棒性的方法訓(xùn)練。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京邁格威科技有限公司,未經(jīng)北京邁格威科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910296090.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 使用大型數(shù)據(jù)庫進(jìn)行對(duì)象識(shí)別的系統(tǒng)及方法
- 一種圖像分類方法及裝置
- 分類模型訓(xùn)練方法及裝置
- 文本分類號(hào)的確定方法、裝置以及電子設(shè)備
- 文本分類方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 圖像分類模型的訓(xùn)練、圖像分類方法、裝置、設(shè)備及介質(zhì)
- 基于深度學(xué)習(xí)的圖像分類方法、裝置、服務(wù)器及介質(zhì)
- 模型生成方法、文本分類方法、裝置、設(shè)備及介質(zhì)
- 一種數(shù)據(jù)分類方法、裝置及系統(tǒng)
- 一種從局部到整體感知的電網(wǎng)場景預(yù)警分類方法及系統(tǒng)
- 用于校準(zhǔn)移動(dòng)魯棒性優(yōu)化函數(shù)的方法和設(shè)備
- 針對(duì)射程不確定性的質(zhì)子重離子調(diào)強(qiáng)放療魯棒優(yōu)化方法
- 基于備用整定的雙層魯棒機(jī)組組合方法
- 一種交直流混聯(lián)微網(wǎng)的隨機(jī)魯棒耦合型優(yōu)化調(diào)度方法
- 一種基于多路徑的魯棒性傳輸測評(píng)方法
- 一種基于分類不確定集的電力系統(tǒng)環(huán)境經(jīng)濟(jì)魯棒調(diào)度方法
- 一種基于參數(shù)范圍匹配的產(chǎn)品魯棒性分析方法
- 一種大規(guī)模染色陣列魯棒性驗(yàn)證方法
- 一種Geiger型索穹頂結(jié)構(gòu)魯棒性優(yōu)化系統(tǒng)
- 一種射頻功率LDMOS器件封裝級(jí)魯棒性評(píng)估方法





