[發(fā)明專利]一種用于OCR圖像識別模型訓練數(shù)據(jù)生成的方法及設(shè)備有效
| 申請?zhí)枺?/td> | 202011356431.3 | 申請日: | 2020-11-26 |
| 公開(公告)號: | CN112508000B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 唐櫟;謝利如 | 申請(專利權(quán))人: | 上海展灣信息科技有限公司 |
| 主分類號: | G06V10/22 | 分類號: | G06V10/22;G06V10/20;G06F18/214 |
| 代理公司: | 上海百一領(lǐng)御專利代理事務所(普通合伙) 31243 | 代理人: | 王奎宇;朱永海 |
| 地址: | 200090 上海市楊浦區(qū)黃興*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 ocr 圖像 識別 模型 訓練 數(shù)據(jù) 生成 方法 設(shè)備 | ||
1.一種用于OCR圖像識別模型訓練數(shù)據(jù)生成的方法,其特征在于,所述方法包括:
獲取OCR圖像,其中,所述OCR圖像包含一個或者多個參數(shù)的名稱及參數(shù)值;
基于所述參數(shù),將所述OCR圖像裁剪為若干個參數(shù)圖片,其中,每個參數(shù)圖片包含一個參數(shù)的名稱及參數(shù)值;
識別每個參數(shù)圖片中參數(shù)的名稱及參數(shù)值的每個字符;
基于預設(shè)字符數(shù)據(jù)庫,從所述字符數(shù)據(jù)庫中選擇與所述參數(shù)圖片中每個字符匹配的字符圖片,將選擇出的每個字符圖片按順序拼接成所述參數(shù)圖片的拼接圖片,并基于與所述預設(shè)字符數(shù)據(jù)庫對應的預設(shè)標注數(shù)據(jù)庫,將每個字符對應的字符圖片的標注順序組合,以獲得所述參數(shù)圖片對應的拼接圖片的標注;
遍歷每個參數(shù)圖片,將獲得的每個參數(shù)圖片對應的拼接圖片順序拼接,以確定所述OCR圖像對應的拼接圖片,并將獲得的每個參數(shù)圖片對應的拼接圖片的標注順序組合,以確定所述OCR圖像對應的拼接圖片的標注;
將所述OCR圖像對應的拼接圖片及其標注確定為所述OCR圖像識別模型的訓練數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述基于所述參數(shù),將所述OCR圖像裁剪為若干個參數(shù)圖片之前,對所述OCR圖像進行預處理。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述OCR圖像進行預處理包括:
對所述OCR圖像進行灰化、銳化和/或尺寸縮放處理;
對灰化、銳化和/或尺寸縮放處理后的OCR圖像進行背景標準化處理。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述背景標準化處理包括:
色度聚類;
稀少像素顆粒群體篩濾,其中,所述稀少像素顆粒群體的像素數(shù)量不滿足臨界值;
基于篩濾后的像素顆粒群體確定背景與字符的色度分類。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于篩濾后的像素顆粒群體確定背景與字符的色度分類包括:
基于篩濾后的像素顆粒群體,生成所有色度值的混合高斯分布;
確定所述混合高斯分布的峰間期望序列;
根據(jù)所述峰間期望序列確定所述像素顆粒群體的色度分布的期望間距;
根據(jù)所述期望間距確定背景與字符的色度分類。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述預設(shè)字符數(shù)據(jù)庫及預設(shè)標注數(shù)據(jù)庫的構(gòu)建包括:
獲取若干經(jīng)過預處理的OCR圖像,其中,所述若干經(jīng)過預處理的OCR圖像包含用于表達所述參數(shù)的名稱及參數(shù)值的全部字符;
遍歷每個OCR圖像,裁剪并提取出所有不重復的字符,并獲取所述所有不重復的字符的每個字符對應的字符圖片及所述字符圖片對應的標注;
將所有字符圖片集合,以構(gòu)建成所述預設(shè)字符數(shù)據(jù)庫,并將所有字符圖片對應的標注集合成所述預設(shè)字符數(shù)據(jù)庫對應的預設(shè)標注數(shù)據(jù)庫。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述基于與所述預設(shè)字符數(shù)據(jù)庫對應的預設(shè)標注數(shù)據(jù)庫,將每個字符對應的字符圖片的標注順序組合,以獲得所述參數(shù)圖片對應的拼接圖片的標注包括:
基于所述預設(shè)標注數(shù)據(jù)庫,參照字符圖片的拼接順序從所述預設(shè)標注數(shù)據(jù)庫中選擇出每個字符圖片對應的標注;
將選擇出的每個字符圖片對應的標注順序組合成所述參數(shù)圖片對應的拼接圖片的標注。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述將選擇出的每個字符圖片按順序拼接成所述參數(shù)圖片的拼接圖片還包括:
在將選擇出的每個字符圖片按順序拼接過程中,在字符圖片之間加入第一隨機背景間隔。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述遍歷每個參數(shù)圖片,將獲得的每個參數(shù)圖片對應的拼接圖片順序拼接,以確定所述OCR圖像對應的拼接圖片還包括:
在將每個參數(shù)圖片對應的拼接圖片順序拼接過程中,在拼接圖片之間加入第二隨機背景間隔。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海展灣信息科技有限公司,未經(jīng)上海展灣信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011356431.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- OCR文檔識別方法及其裝置
- 智能調(diào)度多OCR識別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學系統(tǒng)的OCR識別方法、裝置和終端
- OCR識別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評估方法、裝置、設(shè)備及可讀存儲介質(zhì)
- OCR模型訓練方法、系統(tǒng)及裝置
- 識別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計算機設(shè)備及存儲介質(zhì)
- OCR訓練數(shù)據(jù)生成方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





