[發明專利]一種圖像處理方法、裝置及電子設備在審
| 申請號: | 202210113499.1 | 申請日: | 2022-01-30 |
| 公開(公告)號: | CN114445811A | 公開(公告)日: | 2022-05-06 |
| 發明(設計)人: | 王鵬;謝群義;恩孟一;欽夏孟;姚錕 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V10/40;G06V10/74;G06V10/774;G06V10/82;G06K9/62;G06N3/08 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 馬敬;丁蕓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 處理 方法 裝置 電子設備 | ||
本公開提供了一種圖像處理方法、裝置及電子設備,涉及人工智能技術領域,尤其涉及深度學習、計算機視覺技術領域,可應用于OCR等應用場景。具體實現方案為:將目標樣本圖像、所述目標樣本圖像的檢測結果輸入至預先經過訓練的特征提取模型,得到所述特征提取模型輸出的所述目標樣本圖像的目標樣本特征;針對每個候選樣本圖像,將所述候選樣本圖像和所述候選樣本圖像的檢測結果輸入至所述特征提取模型,得到所述特征提取模型輸出的所述候選樣本圖像的候選樣本特征;從各所述候選樣本圖像中選取匹配候選樣本圖像,作為用于訓練目標檢測模型的樣本圖像。可以篩選出能夠對目標檢測模型定向訓練的樣本圖像,以提高目標檢測模型的準確性。
技術領域
本公開涉及人工智能技術領域,尤其涉及深度學習、計算機視覺技術領域,可應用于OCR(Opitcal Character Recognition,光學字符識別)等應用場景。特別涉及一種圖像處理方法、裝置及電子設備。
背景技術
基于深度學習訓練得到的檢測模型能夠檢測出圖像中特定對象所處的位置。在訓練檢測模型的過程中,已經用于訓練檢測模型的樣本圖像中不同類別的圖像的數量往往不同,因此后續訓練過程中使用不同類別的圖像對檢測模型進行訓練時的效率不同。
發明內容
本公開提供了一種圖像處理方法、裝置及電子設備。
根據本公開的第一方面,提供了一種圖像處理方法,包括:
將目標樣本圖像、所述目標樣本圖像的檢測結果輸入至預先經過訓練的特征提取模型,得到所述特征提取模型輸出的所述目標樣本圖像的目標樣本特征,其中,所述檢測結果用于表示樣本圖像中對象所處的位置;
針對每個候選樣本圖像,將所述候選樣本圖像和所述候選樣本圖像的檢測結果輸入至所述特征提取模型,得到所述特征提取模型輸出的所述候選樣本圖像的候選樣本特征;
從各所述候選樣本圖像中選取匹配候選樣本圖像,作為用于訓練目標檢測模型的樣本圖像,其中,所述匹配候選樣本圖像的所述候選樣本特征與所述目標樣本特征匹配;
其中,所述特征提取模型預先經過多組訓練數據的訓練,每組所述訓練數據包括:至少一個樣本圖像對,用于表示所述樣本圖像對中的兩個樣本圖像是否相似的標簽,所述樣本圖像對中的兩個樣本標注有檢測結果。
根據本公開的第二方面,提供了一種特征提取模型訓練方法,包括:
針對每個樣本圖像對中的每個樣本圖像,將所述樣本圖像和所述樣本圖像中的檢測結果輸入至原始模型,得到所述原始模型輸出的樣本特征;
針對每個樣本樣本圖像對,計算所述樣本圖像對中兩個樣本圖像的所述樣本特征間的相似度;
針對每個樣本樣本圖像對,根據所述相似度以及用于表示所述樣本圖像對中的兩個樣本圖像是否相似的標簽,調整所述原始模型的模型參數,直至達到預設收斂條件,將經過調整的所述原始模型作為特征提取模型。
根據本公開的第三方面,提供了一種圖像處理裝置,包括:
第一特征提取模塊,用于將目標樣本圖像、所述目標樣本圖像的檢測結果輸入至預先經過訓練的特征提取模型,得到所述特征提取模型輸出的所述目標樣本圖像的目標樣本特征,其中,所述檢測結果用于表示樣本圖像中對象所處的位置;
第二特征提取模塊,用于針對每個候選樣本圖像,將所述候選樣本圖像和所述候選樣本圖像的檢測結果輸入至所述特征提取模型,得到所述特征提取模型輸出的所述候選樣本圖像的候選樣本特征;
樣本篩選模塊,用于從各所述候選樣本圖像中選取匹配候選樣本圖像,作為用于訓練目標檢測模型的樣本圖像,其中,所述匹配候選樣本圖像的所述候選樣本特征與所述目標樣本特征匹配;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210113499.1/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





