[發明專利]一種用于OCR圖像識別模型訓練數據生成的方法及設備有效
| 申請號: | 202011356431.3 | 申請日: | 2020-11-26 |
| 公開(公告)號: | CN112508000B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 唐櫟;謝利如 | 申請(專利權)人: | 上海展灣信息科技有限公司 |
| 主分類號: | G06V10/22 | 分類號: | G06V10/22;G06V10/20;G06F18/214 |
| 代理公司: | 上海百一領御專利代理事務所(普通合伙) 31243 | 代理人: | 王奎宇;朱永海 |
| 地址: | 200090 上海市楊浦區黃興*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 ocr 圖像 識別 模型 訓練 數據 生成 方法 設備 | ||
本申請通過一種用于OCR圖像識別模型訓練數據生成的方法及設備,獲取OCR圖像,其中,所述OCR圖像包含一個或者多個參數的名稱及參數值;基于所述參數,將所述OCR圖像裁剪為若干個參數圖片;識別每個參數圖片中的每個字符;基于預設字符數據庫及預設標注數據庫,將每個字符對應的字符圖片順序拼接,并將每個字符圖片的標注順序組合,以獲得參數圖片的拼接圖片及其標注;遍歷每個參數圖片,將獲得的每個拼接圖片順序拼接,以確定所述OCR圖像對應的拼接圖片,并將獲得的每個拼接圖片的標注順序組合,以確定所述OCR圖像對應的拼接圖片的標注;將所述OCR圖像對應的拼接圖片及其標注確定為所述OCR圖像識別模型的訓練數據。通過該方法可獲得高質量的訓練數據。
技術領域
本申請涉及計算機圖像處理技術領域,尤其涉及一種用于OCR圖像識別模型訓練數據生成的技術。
背景技術
OCR圖像識別技術是通過掃描和攝像等光學輸入方式獲取紙張上的文字圖像信息,利用各種模式識別算法分析文字形態特征,可以將票據、報刊、書籍、文稿及其它印刷品轉化為文字圖像信息,再利用圖像識別技術將文字圖像信息轉化為可以使用的計算機輸入的技術。通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度等四個方面作為OCR圖像識別技術的評測依據。
現有的OCR圖像識別技術的內核算法大多來自于google(谷歌)開發及維護的開源識別工具Tesseract模型。Tesseract模型常用的訓練樣本主要來自于各行各業的手寫體、正規體等,但針對專業領域(比如工業控制領域)的OCR圖像的識別精度就比較低。
發明內容
本申請的目的是提供一種用于OCR圖像識別模型訓練數據生成的方法及設備,用以解決現有工業控制領域OCR圖像識別精度不高的技術問題。
根據本申請的一個方面,提供了一種用于OCR圖像識別模型訓練數據生成的方法,其中,所述方法包括:
獲取OCR圖像,其中,所述OCR圖像包含一個或者多個參數的名稱及參數值;
基于所述參數,將所述OCR圖像裁剪為若干個參數圖片,其中,每個參數圖片包含一個參數的名稱及參數值;
識別每個參數圖片中參數的名稱及參數值的每個字符;
基于預設字符數據庫及與所述預設字符數據庫對應的預設標注數據庫,將每個字符對應的字符圖片順序拼接,并將每個字符對應的字符圖片的標注順序組合,以獲得所述參數圖片對應的拼接圖片及所述參數圖片對應的拼接圖片的標注;
遍歷每個參數圖片,將獲得的每個參數圖片對應的拼接圖片順序拼接,以確定所述OCR圖像對應的拼接圖片,并將獲得的每個參數圖片對應的拼接圖片的標注順序組合,以確定所述OCR圖像對應的拼接圖片的標注;
將所述OCR圖像對應的拼接圖片及其標注確定為所述OCR圖像識別模型的訓練數據。
可選地,其中,在所述基于所述參數,將所述OCR圖像裁剪為若干個參數圖片之前,對所述OCR圖像進行預處理。
可選地,其中,所述對所述OCR圖像進行預處理包括:
對所述OCR圖像進行灰化、銳化和/或尺寸縮放處理;
對灰化、銳化和/或尺寸縮放處理后的OCR圖像進行背景標準化處理。
可選地,其中,所述背景標準化處理包括:
色度聚類;
稀少像素顆粒群體篩濾;
基于篩濾后的像素顆粒群體確定背景與字符的色度分類。
可選地,其中,所述基于篩濾后的像素顆粒群體確定背景與字符的色度分類包括:
基于篩濾后的像素顆粒群體生成混合高斯分布;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海展灣信息科技有限公司,未經上海展灣信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011356431.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





