[發明專利]圖像處理方法、圖像識別方法及裝置在審
| 申請號: | 202310348257.5 | 申請日: | 2023-04-03 |
| 公開(公告)號: | CN116363663A | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 秦魏;謝群義;張曉強;欽夏孟;姚錕 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V10/82;G06V20/62;G06N3/0455 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 盧浩;黃健 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 識別 裝置 | ||
本公開提供了一種圖像處理方法、圖像識別方法及裝置,涉及人工智能技術領域,具體涉及計算機視覺、光學字符識別、深度學習等技術領域,可應用于智慧金融、智慧政務等場景。具體實現方案為:對第一樣本圖像中的樣本數字文本進行預測,得到預測結果,其中,第一樣本圖像為樣本對象的圖像,對預測結果進行驗證,得到驗證結果,根據驗證結果,構建預測結果、以及樣本數字文本的預設標注結果之間的損失函數,根據損失函數生成文本識別模型,其中,文本識別模型用于對待識別對象中的待識別數字文本進行識別,可以相對節約收斂時間,提高訓練效率,且可以相對提高訓練的可靠性,從而提高文本識別模型的準確性和可靠性。
技術領域
本公開涉及人工智能技術領域,具體涉及計算機視覺、光學字符識別、深度學習等技術領域,可應用于智慧金融、智慧政務等場景,尤其涉及一種圖像處理方法、圖像識別方法及裝置。
背景技術
自深度學習的概念被提出來后,網絡模型(如卷積神經網絡)在圖像處理(如圖像檢測、圖像識別等)等領域得到了廣泛的發展。
在相關技術中,可以獲取樣本圖像,并根據樣本圖像對卷積神經網絡進行迭代訓練,從而得到具有識別能力的文本識別模型。
發明內容
本公開提供了一種用于提高效率和可靠性的圖像處理方法、圖像識別方法及裝置。
根據本公開的第一方面,提供了一種圖像處理方法,包括:
對第一樣本圖像中的樣本數字文本進行預測,得到預測結果,其中,所述第一樣本圖像為樣本對象的圖像;
對所述預測結果進行驗證處理,得到驗證結果,并根據所述驗證結果,構建所述預測結果、以及所述樣本數字文本的預設標注結果之間的損失函數;
根據所述損失函數生成文本識別模型,其中,所述文本識別模型用于對待識別對象中的待識別數字文本進行識別。
根據本公開的第二方面,提供了一種圖像處理方法,包括:
獲取第三樣本圖像,所述第三樣本圖像中包括被遮蓋文本圖像和未被遮蓋文本圖像;
根據所述被遮蓋文本圖像和所述未被遮蓋文本圖像,對所述被遮蓋文本圖像中的被遮蓋文本進行預測,得到預測文本;
根據所述預測文本訓練得到解碼器;
其中,所述解碼器用于對第一樣本圖像中的樣本數字文本進行預測,得到預測結果;所述預測結果用于根據對所述預測結果的驗證結果構建所述預測結果、以及所述樣本數字文本的預設標注結果之間的損失函數;所述損失函數用于生成文本識別模型。
根據本公開的第三方面,提供了一種圖像識別方法,包括:
獲取待識別圖像,其中,所述待識別圖像為待識別對象的圖像,所述待識別對象中包括待識別數字文本;
將所述待識別圖像輸入至文本識別模型,輸出所述待識別數字文本;
其中,所述文本識別模型是基于如第一方面所述的方法生成的。
根據本公開的第四方面,提供了一種圖像處理裝置,包括:
預測單元,用于對第一樣本圖像中的樣本數字文本進行預測,得到預測結果,其中,所述第一樣本圖像為樣本對象的圖像;
驗證單元,用于對所述預測結果進行驗證處理,得到驗證結果;
構建單元,用于根據所述驗證結果,構建所述預測結果、以及所述樣本數字文本的預設標注結果之間的損失函數;
生成單元,用于根據所述損失函數生成文本識別模型,其中,所述文本識別模型用于對待識別對象中的待識別數字文本進行識別。
根據本公開的第五方面,提供了一種圖像處理裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310348257.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





