[發(fā)明專利]圖像分類方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202111642391.3 | 申請(qǐng)日: | 2021-12-29 |
| 公開(kāi)(公告)號(hào): | CN114298224A | 公開(kāi)(公告)日: | 2022-04-08 |
| 發(fā)明(設(shè)計(jì))人: | 姚俊榮 | 申請(qǐng)(專利權(quán))人: | 云從科技集團(tuán)股份有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06V10/764;G06V10/774 |
| 代理公司: | 北京瀚仁知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11482 | 代理人: | 屠曉旭;陳敏 |
| 地址: | 511457 廣東省廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 分類 方法 裝置 以及 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體提供一種圖像分類方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),旨在解決如何提高圖像分類準(zhǔn)確性與效率的問(wèn)題。為此目的,本發(fā)明的方法包括:將當(dāng)前教師模型的特征提取網(wǎng)絡(luò)劃分成至少一個(gè)第一特征提取層,將學(xué)生模型的特征提取網(wǎng)絡(luò)劃分成至少一個(gè)第二特征提取層且第一、第二特征提取層一一對(duì)應(yīng);獲取當(dāng)前教師模型中第一特征提取層提取到的教師圖像特征以及獲取與第一特征提取層對(duì)應(yīng)的第二特征提取層提取到的學(xué)生圖像特征。采用知識(shí)蒸餾方法,使所有教師模型同時(shí)指導(dǎo)學(xué)生模型使用每個(gè)教師模型各自對(duì)應(yīng)的教師圖像特征與學(xué)生圖像特征進(jìn)行圖像分類訓(xùn)練,提高分類準(zhǔn)確性。同時(shí)學(xué)生模型的模型參數(shù)少,因而具備較高的分類效率。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體提供一種圖像分類方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
在圖像處理技術(shù)領(lǐng)域中通常采用基于神經(jīng)網(wǎng)絡(luò)的圖像分類模型進(jìn)行圖像分類,而這些圖像分類模型的模型精度與推理速度往往呈負(fù)相關(guān)關(guān)系,即模型參數(shù)越多模型精度越高而推理速度則越低,模型參數(shù)越少則模型精度越低而推理速度則越高。目前為了獲取模型參數(shù)少且模型精度高的圖像分類模型,可以通過(guò)知識(shí)蒸餾(Knowledge Distilling)方法,使用模型參數(shù)多且模型精度高的教師模型(Teacher network)指導(dǎo)模型參數(shù)少的學(xué)生模型(Student network)訓(xùn)練,實(shí)現(xiàn)從教師模型到學(xué)生模型的知識(shí)遷移(Knowledgetransfer),提高學(xué)生模型的模型精度。雖然通過(guò)知識(shí)蒸餾方法能夠在一定程度上緩解學(xué)生模型由于模型參數(shù)少而導(dǎo)致的模型精度較低的問(wèn)題,但是學(xué)生模型與教師模型之間的模型精度差距仍然比較大,當(dāng)在對(duì)圖像分類準(zhǔn)確性與分類效率的要求都比較高的應(yīng)用場(chǎng)景中應(yīng)用這些學(xué)生模型進(jìn)行圖像分類時(shí)將無(wú)法得到準(zhǔn)確性較高的圖像分類結(jié)果,降低了這些應(yīng)用場(chǎng)景中圖像分類的準(zhǔn)確性。
相應(yīng)地,本領(lǐng)域需要一種新的圖像分類方案來(lái)解決上述問(wèn)題。
發(fā)明內(nèi)容
為了克服上述缺陷,提出了本發(fā)明,以提供解決或至少部分地解決如何同時(shí)提高圖像分類準(zhǔn)確性與效率的技術(shù)問(wèn)題的圖像分類方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
在第一方面,本發(fā)明提供一種圖像分類方法,所述方法包括:
針對(duì)每個(gè)教師模型,將當(dāng)前教師模型的特征提取網(wǎng)絡(luò)劃分成至少一個(gè)第一特征提取層,將學(xué)生模型的特征提取網(wǎng)絡(luò)劃分成至少一個(gè)第二特征提取層且所述第一特征提取層與所述第二特征提取層一一對(duì)應(yīng);其中,所述教師模型是訓(xùn)練好的圖像分類模型;
獲取當(dāng)前教師模型中每個(gè)第一特征提取層提取到的圖像樣本的教師圖像特征以及獲取學(xué)生模型中與每個(gè)第一特征提取層各自對(duì)應(yīng)的第二特征提取層提取到的圖像樣本的學(xué)生圖像特征;
采用知識(shí)蒸餾方法,使所有教師模型同時(shí)指導(dǎo)所述學(xué)生模型使用每個(gè)教師模型各自對(duì)應(yīng)的教師圖像特征與學(xué)生圖像特征進(jìn)行圖像分類訓(xùn)練;
采用訓(xùn)練好的學(xué)生模型進(jìn)行圖像分類。
在上述圖像分類方法的一個(gè)技術(shù)方案中,“采用知識(shí)蒸餾方法,使所有教師模型同時(shí)指導(dǎo)所述學(xué)生模型使用每個(gè)教師模型各自對(duì)應(yīng)的教師圖像特征與學(xué)生圖像特征進(jìn)行圖像分類訓(xùn)練”的步驟具體包括:
采用知識(shí)蒸餾方法并按照下式所示的知識(shí)蒸餾函數(shù)Ltotal進(jìn)行圖像分類訓(xùn)練:
Ltotal=LCE+Lteacher
其中,LCE表示所述學(xué)生模型對(duì)所述圖像樣本進(jìn)行圖像分類訓(xùn)練時(shí)確定的損失函數(shù),所述Lteacher表示同時(shí)利用所有教師模型對(duì)所述學(xué)生模型使用每個(gè)教師模型各自對(duì)應(yīng)的教師圖像特征與學(xué)生圖像特征進(jìn)行訓(xùn)練指導(dǎo)學(xué)習(xí)時(shí)確定的知識(shí)蒸餾損失函數(shù)。
在上述圖像分類方法的一個(gè)技術(shù)方案中,所述知識(shí)蒸餾損失函數(shù)Lteacher如下式所示:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云從科技集團(tuán)股份有限公司,未經(jīng)云從科技集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111642391.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





