[發(fā)明專利]模型訓(xùn)練、圖像識別方法和裝置在審
| 申請?zhí)枺?/td> | 202210171304.9 | 申請日: | 2022-02-24 |
| 公開(公告)號: | CN114548288A | 公開(公告)日: | 2022-05-27 |
| 發(fā)明(設(shè)計)人: | 陶大程;金銳 | 申請(專利權(quán))人: | 京東科技信息技術(shù)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/94;G06V10/774 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100176 北京市大興區(qū)經(jīng)濟(jì)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 訓(xùn)練 圖像 識別 方法 裝置 | ||
本申請公開了模型訓(xùn)練方法和裝置,涉及圖像處理技術(shù)領(lǐng)域。該方法的一具體實施方式包括:響應(yīng)于獲取到樣本對集,對于每一樣本對,將樣本對輸入初始師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)和教師網(wǎng)絡(luò);基于學(xué)生網(wǎng)絡(luò)中的主回歸器針對第一圖像的預(yù)測值、針對第二圖像的預(yù)測值,對抗回歸器針對第一圖像的預(yù)測值,以及第一圖像的標(biāo)簽和第二圖像的偽標(biāo)簽,構(gòu)建目標(biāo)損失函數(shù)以對初始師生網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到第一師生網(wǎng)絡(luò);基于樣本對集中的第二圖像,分別對第一師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)的特征提取器和對抗回歸器進(jìn)行訓(xùn)練,得到第二師生網(wǎng)絡(luò);將第二師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)確定為識別模型。該實施方式有效提升了訓(xùn)練得到的識別模型的準(zhǔn)確性和魯棒性。
技術(shù)領(lǐng)域
本申請涉及計算機(jī)技術(shù)領(lǐng)域,具體涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種模型訓(xùn)練、圖像識別方法和裝置。
背景技術(shù)
目前所設(shè)計的高精度模型嚴(yán)重依賴大量的標(biāo)記數(shù)據(jù),一旦缺少足夠的訓(xùn)練數(shù)據(jù),模型的準(zhǔn)確性和魯棒性都會受到極大限制。然而,實際場景中的數(shù)據(jù)標(biāo)注并不是一件容易的事,不僅費(fèi)時費(fèi)力而且可能出現(xiàn)標(biāo)注錯誤的情況。目前有不少合成數(shù)據(jù)集,它們具有大量容易獲取且標(biāo)注準(zhǔn)確的圖片,但現(xiàn)實世界的數(shù)據(jù)集(目標(biāo)域)與合成數(shù)據(jù)集(源域)的圖片在紋理和背景上有著巨大差異,這就使得直接使用合成數(shù)據(jù)集訓(xùn)練的模型在實際應(yīng)用中泛化性很差。因此無監(jiān)督領(lǐng)域自適應(yīng)問題,即如何利用標(biāo)注準(zhǔn)確但存在數(shù)據(jù)分布差異的源域數(shù)據(jù)來指導(dǎo)模型在目標(biāo)域上的訓(xùn)練,具有重要的實際價值。
目前,對抗訓(xùn)練是領(lǐng)域自適應(yīng)任務(wù)中常見的解決方案之一。通過在特征空間上的不斷對抗博弈,使得源域和目標(biāo)域的數(shù)據(jù)分布差異盡可能小。這樣基于源域數(shù)據(jù)訓(xùn)練的模型,就可以應(yīng)用于目標(biāo)域數(shù)據(jù)上。
發(fā)明內(nèi)容
本申請實施例提供了一種模型訓(xùn)練方法、裝置、設(shè)備以及存儲介質(zhì)。
根據(jù)第一方面,本申請實施例提供了一種模型訓(xùn)練方法,該方法包括:響應(yīng)于獲取到樣本對集,對于每一樣本對,將樣本對輸入初始師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)和教師網(wǎng)絡(luò);基于學(xué)生網(wǎng)絡(luò)中的主回歸器針對第一圖像的預(yù)測值、針對第二圖像的預(yù)測值,對抗回歸器針對第一圖像的預(yù)測值,以及第一圖像的標(biāo)簽和第二圖像的偽標(biāo)簽,構(gòu)建目標(biāo)損失函數(shù)以對初始師生網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到第一師生網(wǎng)絡(luò);基于樣本對集中的第二圖像,分別對第一師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)的特征提取器和對抗回歸器進(jìn)行訓(xùn)練,得到第二師生網(wǎng)絡(luò);將第二師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)確定為識別模型。
根據(jù)第二方面,本申請實施例提供了一種圖像識別方法,該方法包括:獲取包含目標(biāo)對象的待識別圖像;將待識別圖像輸入識別模型,得到目標(biāo)對象的關(guān)鍵點(diǎn)信息,其中,識別模型是如上述第一方面任一實現(xiàn)方式描述的方法得到的識別模型。
根據(jù)第三方面,本申請實施例提供了一種模型訓(xùn)練裝置,該裝置包括:獲取數(shù)據(jù)模塊,被配置成響應(yīng)于獲取到樣本對集,對于每一樣本對,將樣本對輸入初始師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)和教師網(wǎng)絡(luò);第一訓(xùn)練模塊,被配置成基于學(xué)生網(wǎng)絡(luò)中的主回歸器針對第一圖像的預(yù)測值、針對第二圖像的預(yù)測值,對抗回歸器針對第一圖像的預(yù)測值,以及第一圖像的標(biāo)簽和第二圖像的偽標(biāo)簽,構(gòu)建目標(biāo)損失函數(shù)以對初始師生網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到第一師生網(wǎng)絡(luò);第二訓(xùn)練模塊,被配置成基于樣本對集中的第二圖像,分別對第一師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)的特征提取器和對抗回歸器進(jìn)行訓(xùn)練,得到第二師生網(wǎng)絡(luò);模型確定模塊,被配置成將第二師生網(wǎng)絡(luò)中的學(xué)生網(wǎng)絡(luò)確定為識別模型。
根據(jù)第四方面,本申請實施例提供了一種圖像識別裝置,該裝置包括:獲取圖像模塊,被配置成獲取包含目標(biāo)對象的待識別圖像;識別圖像模塊,被配置成將待識別圖像輸入識別模型,得到目標(biāo)對象的關(guān)鍵點(diǎn)信息,其中,識別模型是如上述第一方面任一實現(xiàn)方式描述的方法得到的識別模型。
根據(jù)第五方面,本申請實施例提供了一種電子設(shè)備,該電子設(shè)備包括一個或多個處理器;存儲裝置,其上存儲有一個或多個程序,當(dāng)一個或多個程序被該一個或多個處理器執(zhí)行,使得一個或多個處理器實現(xiàn)如第一方面或第二方面中任一實現(xiàn)方式描述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于京東科技信息技術(shù)有限公司,未經(jīng)京東科技信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210171304.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





