[發(fā)明專利]基于密集連接殘差網(wǎng)絡(luò)的圖像分類方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910135688.7 | 申請(qǐng)日: | 2019-02-21 |
| 公開(公告)號(hào): | CN109978003A | 公開(公告)日: | 2019-07-05 |
| 發(fā)明(設(shè)計(jì))人: | 王永雄;嚴(yán)龍;宋天中;張震 | 申請(qǐng)(專利權(quán))人: | 上海理工大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海天協(xié)和誠(chéng)知識(shí)產(chǎn)權(quán)代理事務(wù)所 31216 | 代理人: | 沈國(guó)良 |
| 地址: | 200093 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 殘差 圖像分類 圖像特征 數(shù)據(jù)預(yù)處理 計(jì)算資源 連接網(wǎng)絡(luò) 模型訓(xùn)練 輸入圖片 圖片分類 圖片輸入 圖片數(shù)據(jù) 網(wǎng)絡(luò)提取 硬件設(shè)備 網(wǎng)絡(luò) 分類器 計(jì)算量 識(shí)別率 占用 學(xué)習(xí) | ||
本發(fā)明公開了一種基于密集連接殘差網(wǎng)絡(luò)的圖像分類方法,本方法首先對(duì)輸入圖片進(jìn)行數(shù)據(jù)預(yù)處理,并擴(kuò)充圖片數(shù)據(jù)量;然后將圖片輸入到密集連接殘差網(wǎng)絡(luò)提取圖像特征;最后將提取到的圖像特征輸入到Softmax分類器,得出圖片分類結(jié)果。本方法克服圖像分類任務(wù)中傳統(tǒng)方法效果不好、常用的深度學(xué)習(xí)方法計(jì)算量太大、模型訓(xùn)練和運(yùn)行對(duì)硬件設(shè)備要求太高的缺陷,通過(guò)結(jié)合殘差網(wǎng)絡(luò)和密集連接網(wǎng)絡(luò)的優(yōu)點(diǎn),達(dá)到較高的識(shí)別率的同時(shí)占用較少的計(jì)算資源。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器學(xué)習(xí)和機(jī)器視覺技術(shù)領(lǐng)域,尤其涉及一種基于密集連接殘差網(wǎng)絡(luò)的圖像分類方法。
背景技術(shù)
圖像分類是計(jì)算機(jī)視覺領(lǐng)域中最活躍的研究課題之一,迅速和準(zhǔn)確地識(shí)別出物體對(duì)機(jī)器人導(dǎo)航、醫(yī)療診斷、安防、工業(yè)檢測(cè)等有著重要的意義。提取圖像特征是物體識(shí)別中最重要也是最棘手的工作,圖像特征的好壞很大程度上決定了識(shí)別的效果。相比傳統(tǒng)的圖像特征提取方法,深度神經(jīng)網(wǎng)絡(luò)能提取到表達(dá)能力更強(qiáng)的圖像特征,更有利于圖像分類,因此現(xiàn)在大多數(shù)物體識(shí)別框架都基于深度學(xué)習(xí)。但是,目前大多數(shù)用于圖像分類的深度學(xué)習(xí)方法計(jì)算量很大,訓(xùn)練時(shí)間長(zhǎng),對(duì)訓(xùn)練設(shè)備有較高的要求。深度殘差網(wǎng)絡(luò)和密集連接網(wǎng)絡(luò)是近幾年涌現(xiàn)出的優(yōu)秀卷積神經(jīng)網(wǎng)絡(luò)模型,深度殘差網(wǎng)絡(luò)可以有效避免傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型的梯度消失或爆炸以及模型退化問(wèn)題。密集連接網(wǎng)絡(luò)提高參數(shù)的利用率,網(wǎng)絡(luò)能夠利用較少參數(shù)量達(dá)到較高的識(shí)別率,但是網(wǎng)絡(luò)中的大量密集連接不可避免地消耗了大量的GPU內(nèi)存,計(jì)算深層的密集連接網(wǎng)絡(luò)對(duì)機(jī)器的硬件要求較高。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于密集連接殘差網(wǎng)絡(luò)的圖像分類方法,本方法克服傳統(tǒng)深度學(xué)習(xí)方法針對(duì)圖像分類的缺陷,通過(guò)結(jié)合殘差網(wǎng)絡(luò)和密集連接網(wǎng)絡(luò)的優(yōu)點(diǎn),利用較少的參數(shù)量達(dá)到較高的識(shí)別率,減少計(jì)算資源占用,有效提高圖像的識(shí)別率。
為解決上述技術(shù)問(wèn)題,本發(fā)明基于密集連接殘差網(wǎng)絡(luò)的圖像分類方法包括如下步驟:
步驟一、對(duì)輸入圖片進(jìn)行數(shù)據(jù)預(yù)處理,并擴(kuò)充圖片數(shù)據(jù)量;
步驟二、將圖片輸入到密集連接殘差網(wǎng)絡(luò)提取圖像特征,密集連接殘差網(wǎng)絡(luò)由一個(gè)小型密集連接網(wǎng)絡(luò)和一個(gè)殘差結(jié)構(gòu)組成,在密集連接殘差網(wǎng)絡(luò)中,串聯(lián)操作將網(wǎng)絡(luò)內(nèi)的所有卷積層的輸出特征圖串聯(lián)之后再輸入到殘差函數(shù)中;
步驟三、將提取到的圖像特征輸入到Softmax分類器,得出圖片分類結(jié)果。
進(jìn)一步,所述數(shù)據(jù)預(yù)處理將所有樣本均減去整個(gè)數(shù)據(jù)集樣本的均值和方差,使得模型的收斂更快;所述擴(kuò)充圖片數(shù)據(jù)量將圖片隨機(jī)的翻轉(zhuǎn)和旋轉(zhuǎn)訓(xùn)練,以擴(kuò)充數(shù)據(jù)的多樣性,使得模型學(xué)習(xí)更具代表的特征。
進(jìn)一步,所述密集連接殘差網(wǎng)絡(luò)采用下式表示:
yl=y(tǒng)l-1+F(Hd(y0,...,yd]),[W0,...,Wd])
其中yl-1和yl分別為網(wǎng)絡(luò)的第l個(gè)密集連接殘差結(jié)構(gòu)的輸入和輸出,[y0,...,yd][y0,...,yd]表示密集連接殘差網(wǎng)絡(luò)內(nèi)部所有的卷積層,[W0,,Wd]表示密集連接殘差網(wǎng)絡(luò)內(nèi)部每個(gè)卷積層對(duì)應(yīng)的權(quán)重參數(shù)。
進(jìn)一步,所述Softmax分類器的圖片分類操作中,Softmax分類器輸出的是每一個(gè)樣本屬于各個(gè)類別的概率,損失函數(shù)的表達(dá)式如下式所示:
其中,xi表示輸出層第i個(gè)神經(jīng)元的輸入,θ為學(xué)習(xí)參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海理工大學(xué),未經(jīng)上海理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910135688.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 圖像中的對(duì)象的自動(dòng)分類
- 將圖像分類為廣告圖像或非廣告圖像
- 基于場(chǎng)景的圖像分類方法、裝置、系統(tǒng)和存儲(chǔ)介質(zhì)
- 一種圖像分類的方法、裝置和存儲(chǔ)介質(zhì)
- 圖像分類方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 圖像分類模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 圖像分類模型訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 圖像分類模型的訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種圖像分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種圖像分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)挖掘系統(tǒng)中數(shù)據(jù)預(yù)處理的方法、系統(tǒng)及裝置
- 數(shù)據(jù)預(yù)處理方法
- 用于信號(hào)處理器的預(yù)處理單元
- 一種基于插件和組件的數(shù)據(jù)預(yù)處理系統(tǒng)及其實(shí)現(xiàn)方法
- 用于數(shù)據(jù)預(yù)處理裝置的檢查設(shè)備
- 訂單數(shù)據(jù)處理方法和裝置
- 數(shù)據(jù)恢復(fù)方法及系統(tǒng)
- 基于大數(shù)據(jù)的發(fā)票數(shù)據(jù)實(shí)時(shí)聚合裝置
- 一種圖像預(yù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)預(yù)處理方法





