[發明專利]圖像識別方法、裝置及電子設備有效
| 申請號: | 202010370334.3 | 申請日: | 2020-04-30 |
| 公開(公告)號: | CN111695421B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | 楊馥蔚 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/774;G06V10/82;G06N3/0464;G06T5/00 |
| 代理公司: | 北京超凡宏宇知識產權代理有限公司 11463 | 代理人: | 何少巖 |
| 地址: | 100000 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 方法 裝置 電子設備 | ||
本發明提供了一種圖像識別方法、裝置及電子設備,涉及圖像處理技術領域,該方法包括:獲取待識別圖像;將待識別圖像輸入至預訓練得到的圖像識別模型;其中,圖像識別模型包括預處理網絡、元學習網絡和圖像識別網絡;通過元學習網絡基于待識別圖像生成預處理網絡的參數;通過預處理網絡基于元學習網絡生成的參數對待識別圖像進行去模糊處理,得到清晰圖像;通過圖像識別網絡對清晰圖像進行識別,得到圖像識別結果。本發明可以提升圖像識別精度,得到較好的圖像識別效果。
技術領域
本發明涉及圖像處理領域,尤其是涉及一種圖像識別方法、裝置及電子設備。
背景技術
隨著圖像處理技術的不斷發展,圖像識別的應用場景越來越豐富,諸如人臉識別、車牌號識別等,這類技術通過預先訓練好的圖像識別網絡對輸入圖像進行目標識別。然而,在大多數場景中人或車等目標物都是運動的,導致輸入圖像通常會帶有運動模糊,現有的圖像識別網絡在對模糊圖像進行識別時的精度不高,識別效果較差。
發明內容
本發明的目的在于提供一種圖像識別方法、裝置及電子設備,可以提升圖像識別精度,得到較好的圖像識別效果。
第一方面,本發明實施例提供一種圖像識別方法,方法包括:獲取待識別圖像;將待識別圖像輸入至預訓練得到的圖像識別模型;其中,圖像識別模型包括預處理網絡、元學習網絡和圖像識別網絡;通過元學習網絡基于待識別圖像生成預處理網絡的參數;通過預處理網絡基于元學習網絡生成的參數對待識別圖像進行去模糊處理,得到清晰圖像;通過圖像識別網絡對清晰圖像進行識別,得到圖像識別結果。
進一步,預處理網絡為殘差網絡。
進一步,元學習網絡包括依次連接的卷積層和全連接層;所述全連接層的輸出節點數量與所述預處理網絡所需的參數數量相同。
進一步,圖像識別模型的訓練過程包括:獲取樣本圖像對;其中,樣本圖像對包括清晰樣本圖像和與清晰樣本圖像對應的模糊樣本圖像;基于樣本圖像對對元學習網絡和圖像識別網絡進行訓練,直至訓練結束,得到訓練后的圖像識別模型;其中,在訓練過程中,元學習網絡用于基于模糊樣本圖像學習生成預處理網絡的參數;預處理網絡用于基于元學習網絡輸出的參數對模糊樣本圖像進行去模糊處理,得到去模糊圖像;圖像識別網絡用于對去模糊圖像進行圖像識別。
進一步,獲取樣本圖像對的步驟,包括:獲取清晰樣本圖像;對清晰樣本圖像進行運動模糊處理,得到與清晰樣本圖像對應的模糊樣本圖像;基于清晰樣本圖像和模糊樣本圖像組成樣本圖像對。
進一步,對清晰樣本圖像進行運動模糊處理的步驟,包括:采用隨機的卷積參數對清晰樣本圖像進行卷積處理,和/或,為清晰樣本圖像上添加高斯白噪聲。
進一步,基于樣本圖像對對元學習網絡和圖像識別網絡進行訓練,直至訓練結束,得到訓練后的圖像識別模型的步驟,包括:對圖像識別網絡進行預訓練,得到預訓練好的圖像識別網絡;保持預訓練好的圖像識別網絡的參數不變,采用樣本圖像對對元學習網絡進行初始訓練,得到初始訓練好的元學習網絡;采用樣本圖像對對預訓練好的圖像識別網絡和初始訓練好的元學習網絡進行聯合訓練,直至訓練結束,得到訓練后的圖像識別模型。
進一步,采用樣本圖像對對元學習網絡進行初始訓練,得到初始訓練好的元學習網絡的步驟,包括:通過預訓練好的圖像識別網絡對清晰樣本圖像進行特征提取,得到第一圖像特征;通過預處理網絡對模糊樣本圖像進行去模糊處理,得到去模糊圖像;通過預訓練好的圖像識別網絡對去模糊圖像進行特征提取,得到第二圖像特征;基于第一圖像特征和第二圖像特征確定第一損失函數值;根據第一損失函數值對元學習網絡進行初始訓練,得到初始訓練好的元學習網絡。
進一步,采用樣本圖像對對預訓練好的圖像識別網絡和初始訓練好的元學習網絡進行聯合訓練的步驟,包括:基于第一圖像特征確定第二損失函數值;根據第一損失函數值與第二損失函數值確定總損失值;基于總損失值調整預訓練好的圖像識別網絡的參數以及初始訓練好的元學習網絡的參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010370334.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





