[發(fā)明專利]模型處理方法、裝置、存儲介質(zhì)及計算機設(shè)備在審
| 申請?zhí)枺?/td> | 202011287399.8 | 申請日: | 2020-11-17 |
| 公開(公告)號: | CN114510982A | 公開(公告)日: | 2022-05-17 |
| 發(fā)明(設(shè)計)人: | 何天宇;沈旭;黃建強 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V40/10;G06V10/74;G06V10/776;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京博浩百睿知識產(chǎn)權(quán)代理有限責(zé)任公司 11134 | 代理人: | 謝湘寧;張文華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 處理 方法 裝置 存儲 介質(zhì) 計算機 設(shè)備 | ||
本發(fā)明公開了一種模型處理方法、裝置、存儲介質(zhì)及計算機設(shè)備。其中,該方法包括:采用圖像處理模型處理第一圖像,得到與第一圖像對應(yīng)的第二圖像;采用圖像處理模型處理第二圖像,得到與第二圖像對應(yīng)的第三圖像;根據(jù)第一圖像和第三圖像之間的距離,優(yōu)化圖像處理模型。本發(fā)明解決了相關(guān)技術(shù)中,提升圖像處理模型的性能時,效率較低的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機領(lǐng)域,具體而言,涉及一種模型處理方法、裝置、存儲介質(zhì)及計算機設(shè)備。
背景技術(shù)
深度學(xué)習(xí)(Deep Learning)是指多層神經(jīng)網(wǎng)絡(luò)上運用各種機器學(xué)習(xí)算法解決圖像,文本等各種問題的算法集合。圖像處理技術(shù)是深度學(xué)習(xí)技術(shù)的一個重要應(yīng)用方向,應(yīng)用場景極其廣泛。在相關(guān)技術(shù)中,圖像處理技術(shù)一般采用通過大量圖像樣本進行訓(xùn)練得到圖像處理模型,如果圖像處理模型需要獲得較準(zhǔn)確的處理率,需要的進行預(yù)先標(biāo)注的樣本數(shù)量極大,工作量復(fù)雜。因此,在相關(guān)技術(shù)中,對于提升圖像處理模型的性能存在效率較低的問題。
針對上述的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種模型處理方法、裝置、存儲介質(zhì)及計算機設(shè)備,以至少解決相關(guān)技術(shù)中,提升圖像處理模型的性能時,效率較低的技術(shù)問題。
根據(jù)本發(fā)明實施例的一個方面,提供了一種模型處理方法,包括:采用圖像處理模型處理第一圖像,得到與所述第一圖像對應(yīng)的第二圖像;采用所述圖像處理模型處理所述第二圖像,得到與所述第二圖像對應(yīng)的第三圖像;根據(jù)所述第一圖像和所述第三圖像之間的距離,優(yōu)化所述圖像處理模型。
可選地,根據(jù)所述第一圖像和所述第三圖像之間的距離,優(yōu)化所述圖像處理模型包括:構(gòu)造所述第一圖像和所述第三圖像之間距離的損失函數(shù);通過最小化所述損失函數(shù),優(yōu)化所述圖像處理模型。
可選地,所述第一圖像為待處理圖像中第一局部區(qū)域的圖像,所述第二圖像為目標(biāo)圖像中局部區(qū)域的圖像,所述第三圖像為所述待處理圖像中第二局部區(qū)域的圖像。
可選地,采用所述圖像處理模型處理第一圖像,得到與所述第一圖像對應(yīng)的第二圖像包括:獲取所述目標(biāo)圖像的尺寸;采用所述圖像處理模型中的對齊模塊,對所述第一圖像執(zhí)行對齊操作,得到與所述目標(biāo)圖像的尺寸相同的第一圖像;采用所述圖像處理模型中的特征提取模塊分別提取與所述目標(biāo)圖像的尺寸相同的第一圖像的第一特征,以及提取所述目標(biāo)圖像的第二特征;采用所述圖像處理模型中的處理模塊對所述第一特征和所述第二特征進行處理,得到與所述第一圖像對應(yīng)的第二圖像。
可選地,采用所述圖像處理模型處理所述第二圖像,得到與所述第二圖像對應(yīng)的第三圖像包括:獲取所述待處理圖像的尺寸;采用所述圖像處理模型中的對齊模塊,對所述第二圖像執(zhí)行對齊操作,得到與所述待處理圖像的尺寸相同的第二圖像;采用所述圖像處理模型中的特征提取模塊分別提取與所述待處理圖像的尺寸相同的第二圖像的第三特征,以及提取所述待處理圖像的第四特征;采用所述圖像處理模型中的處理模塊對所述第三特征和所述第四特征進行處理,得到與所述第二圖像對應(yīng)的第三圖像。
可選地,所述方法還包括:獲取第四圖像中的局部區(qū)域的圖像,以及第五圖像;采用優(yōu)化后的圖像處理模型處理所述第四圖像中的局部區(qū)域的圖像,以及第五圖像,得到所述第五圖像中與所述第四圖像中的局部區(qū)域?qū)?yīng)的對應(yīng)區(qū)域圖像。
可選地,所述圖像處理模型包括圖像識別模型,用于識別以下預(yù)定局部區(qū)域至少之一:包括人物的行人圖像中的局部區(qū)域,包括物體的物體圖像中的局部區(qū)域,包括人物和物體的場景圖像中局部區(qū)域。
可選地,所述預(yù)定局部區(qū)域包括從監(jiān)控圖像視頻中截取的圖像幀的局部區(qū)域。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011287399.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種降濾失劑的制備方法及降濾失劑
- 下一篇:一種合成異佛爾酮二異氰酸酯的方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





