[發(fā)明專利]一種用于OCR圖像識別模型訓練數(shù)據(jù)生成的方法及設(shè)備有效

申請?zhí)枺?/td>	202011356431.3	申請日：	2020-11-26
公開（公告）號：	CN112508000B	公開（公告）日：	2023-04-07
發(fā)明（設(shè)計）人：	唐櫟;謝利如	申請（專利權(quán)）人：	上海展灣信息科技有限公司
主分類號：	G06V10/22	分類號：	G06V10/22;G06V10/20;G06F18/214
代理公司：	上海百一領(lǐng)御專利代理事務所(普通合伙) 31243	代理人：	王奎宇;朱永海
地址：	200090 上海市楊浦區(qū)黃興***	國省代碼：	上海;31
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種用于 ocr 圖像識別模型訓練數(shù)據(jù) 生成方法設(shè)備
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種用于OCR圖像識別模型訓練數(shù)據(jù)生成的方法，其特征在于，所述方法包括：

獲取OCR圖像，其中，所述OCR圖像包含一個或者多個參數(shù)的名稱及參數(shù)值；

基于所述參數(shù)，將所述OCR圖像裁剪為若干個參數(shù)圖片，其中，每個參數(shù)圖片包含一個參數(shù)的名稱及參數(shù)值；

識別每個參數(shù)圖片中參數(shù)的名稱及參數(shù)值的每個字符；

基于預設(shè)字符數(shù)據(jù)庫，從所述字符數(shù)據(jù)庫中選擇與所述參數(shù)圖片中每個字符匹配的字符圖片，將選擇出的每個字符圖片按順序拼接成所述參數(shù)圖片的拼接圖片，并基于與所述預設(shè)字符數(shù)據(jù)庫對應的預設(shè)標注數(shù)據(jù)庫，將每個字符對應的字符圖片的標注順序組合，以獲得所述參數(shù)圖片對應的拼接圖片的標注；

遍歷每個參數(shù)圖片，將獲得的每個參數(shù)圖片對應的拼接圖片順序拼接，以確定所述OCR圖像對應的拼接圖片，并將獲得的每個參數(shù)圖片對應的拼接圖片的標注順序組合，以確定所述OCR圖像對應的拼接圖片的標注；

將所述OCR圖像對應的拼接圖片及其標注確定為所述OCR圖像識別模型的訓練數(shù)據(jù)。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，在所述基于所述參數(shù)，將所述OCR圖像裁剪為若干個參數(shù)圖片之前，對所述OCR圖像進行預處理。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述對所述OCR圖像進行預處理包括：

對所述OCR圖像進行灰化、銳化和/或尺寸縮放處理；

對灰化、銳化和/或尺寸縮放處理后的OCR圖像進行背景標準化處理。

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述背景標準化處理包括：

色度聚類；

稀少像素顆粒群體篩濾，其中，所述稀少像素顆粒群體的像素數(shù)量不滿足臨界值；

基于篩濾后的像素顆粒群體確定背景與字符的色度分類。

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述基于篩濾后的像素顆粒群體確定背景與字符的色度分類包括：

基于篩濾后的像素顆粒群體，生成所有色度值的混合高斯分布；

確定所述混合高斯分布的峰間期望序列；

根據(jù)所述峰間期望序列確定所述像素顆粒群體的色度分布的期望間距；

根據(jù)所述期望間距確定背景與字符的色度分類。

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述預設(shè)字符數(shù)據(jù)庫及預設(shè)標注數(shù)據(jù)庫的構(gòu)建包括：

獲取若干經(jīng)過預處理的OCR圖像，其中，所述若干經(jīng)過預處理的OCR圖像包含用于表達所述參數(shù)的名稱及參數(shù)值的全部字符；

遍歷每個OCR圖像，裁剪并提取出所有不重復的字符，并獲取所述所有不重復的字符的每個字符對應的字符圖片及所述字符圖片對應的標注；

將所有字符圖片集合，以構(gòu)建成所述預設(shè)字符數(shù)據(jù)庫，并將所有字符圖片對應的標注集合成所述預設(shè)字符數(shù)據(jù)庫對應的預設(shè)標注數(shù)據(jù)庫。

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述基于與所述預設(shè)字符數(shù)據(jù)庫對應的預設(shè)標注數(shù)據(jù)庫，將每個字符對應的字符圖片的標注順序組合，以獲得所述參數(shù)圖片對應的拼接圖片的標注包括：

基于所述預設(shè)標注數(shù)據(jù)庫，參照字符圖片的拼接順序從所述預設(shè)標注數(shù)據(jù)庫中選擇出每個字符圖片對應的標注；

將選擇出的每個字符圖片對應的標注順序組合成所述參數(shù)圖片對應的拼接圖片的標注。

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述將選擇出的每個字符圖片按順序拼接成所述參數(shù)圖片的拼接圖片還包括：

在將選擇出的每個字符圖片按順序拼接過程中，在字符圖片之間加入第一隨機背景間隔。

9.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述遍歷每個參數(shù)圖片，將獲得的每個參數(shù)圖片對應的拼接圖片順序拼接，以確定所述OCR圖像對應的拼接圖片還包括：

在將每個參數(shù)圖片對應的拼接圖片順序拼接過程中，在拼接圖片之間加入第二隨機背景間隔。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海展灣信息科技有限公司，未經(jīng)上海展灣信息科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011356431.3/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】