[發明專利]OCR識別模型訓練方法、OCR識別方法及相關裝置在審
| 申請號: | 202210192272.0 | 申請日: | 2022-02-28 |
| 公開(公告)號: | CN114565751A | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 曹智 | 申請(專利權)人: | 慧擇(成都)網絡科技有限公司 |
| 主分類號: | G06V10/22 | 分類號: | G06V10/22;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 戴皓 |
| 地址: | 614000 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | ocr 識別 模型 訓練 方法 相關 裝置 | ||
1.一種OCR識別模型訓練方法,其特征在于,包括:
將無標注數據的第一圖像樣本切分為多個第一圖像塊,并從所述多個第一圖像塊中隨機選取部分第一圖像塊進行遮擋,得到遮擋圖像塊和未遮擋圖像塊,其中,所述遮擋圖像塊的數量大于所述未遮擋圖像塊的數量;利用所述遮擋圖像塊和所述未遮擋圖像塊,以重構所述第一圖像樣本的預設特征為目標,對預先構建的包含編碼器和第一解碼器的初始特征識別模型進行預訓練,得到預訓練特征識別模型;基于所述預訓練特征識別模型中的編碼器和第二解碼器構建任務處理模型;
將有標注數據的第二圖像樣本切分為多個第二圖像塊;
采用所述多個第二圖像塊和所述第二圖像樣本包含的詞片序列對所述任務處理模型進行訓練,得到的模型作為OCR識別模型。
2.根據權利要求1所述的OCR識別模型訓練方法,其特征在于,所述利用所述遮擋圖像塊和所述未遮擋圖像塊,以重構所述第一圖像樣本的預設特征為目標,對預先構建的包含編碼器和第一解碼器的初始特征識別模型進行預訓練,得到預訓練特征識別模型,包括:
將所述未遮擋圖像塊輸入到所述初始特征識別模型包含的編碼器中,得到所述未遮擋圖像塊的視覺語義信息;
將所述未遮擋圖像塊的視覺語義信息和所述遮擋圖像塊輸入到所述初始特征識別模型包含的第一解碼器中,得到重構出的所述未遮擋圖像塊和所述遮擋圖像塊分別對應的預設特征;
根據重構出的所述未遮擋圖像塊和所述遮擋圖像塊分別對應的預設特征,以及,從所述第一圖像樣本提取的預設特征,對所述初始特征識別模型的參數進行預訓練,得到所述預訓練特征識別模型。
3.根據權利要求2所述的OCR識別模型訓練方法,其特征在于,所述預設特征包括以下特征中的一種或多種:方向梯度直方圖特征、卷積神經網絡特征、局部二值模式特征、Haar-like特征、ORB特征、加速穩健特征和SIFT特征。
4.根據權利要求1所述的OCR識別模型訓練方法,其特征在于,所述采用所述多個第二圖像塊和所述第二圖像樣本包含的詞片序列對任務處理模型進行訓練,得到的模型作為OCR識別模型,包括:
將所述多個第二圖像塊輸入到所述任務處理模型中,得到所述多個第二圖像塊對應的OCR識別結果;
基于所述多個第二圖像塊對應的OCR識別結果和所述第二圖像樣本包含的詞片序列對所述任務處理模型的參數進行訓練,得到所述OCR識別模型。
5.根據權利要求1所述的OCR識別模型訓練方法,其特征在于,圖像樣本的獲取方法,包括:
獲取原始樣本;
對所述原始樣本進行圖像轉換處理,得到處理后的原始樣本,其中,所述圖像轉換處理包括以下處理中的一種或多種:隨機旋轉、高斯模糊、圖像膨脹、圖像腐蝕、下采樣和添加下劃線;
將所述原始樣本和所述處理后的原始樣本作為所述圖像樣本。
6.一種OCR識別方法,其特征在于,應用于如權利要求1~5任一項所述的OCR識別模型,包括:
獲取待識別圖像;
將所述待識別圖像切分為多個待識別圖像塊;
將所述多個待識別圖像塊輸入所述OCR識別模型中,以得到所述OCR識別模型輸出的OCR識別結果,作為所述待識別圖像的OCR識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于慧擇(成都)網絡科技有限公司,未經慧擇(成都)網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210192272.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電池供電裝置及系統
- 下一篇:一種餐廚垃圾沼液的處理方法及處理系統





