[發明專利]一種字符識別方法和裝置有效
| 申請號: | 201910071756.8 | 申請日: | 2019-01-25 |
| 公開(公告)號: | CN109858542B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 戴亦斌;謝春鴻 | 申請(專利權)人: | 廣州云測信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 劉昕;南霆 |
| 地址: | 510260 廣東省廣州市中*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 識別 方法 裝置 | ||
本申請公開了一種字符識別方法和裝置。方法包括:對顯示有至少一個字符的第一字符圖像進行第一處理,所述第一處理用于改變所述至少一個字符的形態;基于所述第一字符圖像中的字符子圖像,生成第二字符圖像,所述字符子圖像為單個字符所占區域的圖像;對所述第二字符圖像進行第二處理,所述第二處理用于在所述第二字符圖像中添加干擾數據;基于所述第二字符圖像和所述第二字符圖像中的字符子圖像所占區域,訓練目標檢測模型,以以供識別目標字符圖像中的字符。可見,本申請通過目標檢測模型對字符圖像中的字符進行識別,能有效提高字符識別的準確度,為自動化測試過程中的驗證碼識別提供支持。
技術領域
本申請涉及計算機技術領域,尤其涉及一種字符識別方法和裝置。
背景技術
字符識別是指對物品上印刷的字符、用戶界面顯示的字符等進行識別的過程。
目前的字符識別方案是利用計算機圖像處理技術對顯示字符串的圖像進行二值、去噪點等處理后,對其中的字符進行分割,然后對單個字符利用OCR技術識別、或者使用深度學習的方式進行識別。但該方案對于字符間存在粘連、存在較粗的干擾線、字符寬度不一致等情況,存在無法對字符進行分割,導致識別成功率較低的問題。
因此,需要提供一種高精度的字符識別方案。
發明內容
本說明書實施例提供一種字符識別方法,用以解決字符識別成功率低的問題。
本說明書實施例還提供一種字符識別方法,包括:
對顯示有至少一個字符的第一字符圖像進行第一處理,所述第一處理用于改變所述至少一個字符的形態;
基于所述第一字符圖像中的字符子圖像,生成第二字符圖像,所述字符子圖像為單個字符所占區域的圖像;
對所述第二字符圖像進行第二處理,所述第二處理用于在所述第二字符圖像中添加干擾數據;
基于所述第二字符圖像和所述第二字符圖像中的字符子圖像所占區域,訓練目標檢測模型,以供識別目標字符圖像中的字符。
本說明書實施例還提供一種字符識別裝置,包括:
第一處理模塊,用于對顯示有至少一個字符的第一字符圖像進行第一處理,所述第一處理用于改變所述至少一個字符的形態;
第二處理模塊,用于基于所述第一字符圖像中的字符子圖像,生成第二字符圖像,所述字符子圖像為單個字符所占區域的圖像;
第三處理模塊,用于對所述第二字符圖像進行第二處理,所述第二處理用于在所述第二字符圖像中添加干擾數據;
訓練模塊,用于基于所述第二字符圖像和所述第二字符圖像中的字符子圖像所占區域,訓練目標檢測模型,以供識別目標字符圖像中的字符。
本說明書實施例還提供一種電子設備,包括:
處理器;以及
被安排成存儲計算機可執行指令的存儲器,所述可執行指令在被執行時使所述處理器執行上述字符識別方法的步驟。
本說明書實施例還提供一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如上述字符識別方法的步驟。
本說明書實施例采用的上述至少一個技術方案能夠達到以下有益效果:
通過將字符圖像及其中的字符子圖像作為樣本數據來訓練目標檢測模型,以基于訓練完成的目標檢測模型識別目標字符圖像中的字符。與現有技術中OCR技術識別方案相比,能有效提高字符的識別成功率,為自動化測試過程中的驗證碼識別提供支持,達到可通過驗證碼的自動識別,提高自動化測試的適用范圍的目的。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州云測信息技術有限公司,未經廣州云測信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910071756.8/2.html,轉載請聲明來源鉆瓜專利網。





