[發明專利]字符識別方法、裝置、電子設備及存儲介質在審
申請號: | 201911036151.1 | 申請日: | 2019-10-29 |
公開(公告)號: | CN110866529A | 公開(公告)日: | 2020-03-06 |
發明(設計)人: | 鄭巖;胡益清 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
主分類號: | G06K9/34 | 分類號: | G06K9/34 |
代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 汪阮磊 |
地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 字符 識別 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例公開了一種字符識別方法、裝置、電子設備及存儲介質,本申請實施例首先獲取待檢測的字符圖像,并從字符圖像中提取特征信息,然后根據特征信息對字符圖像修正處理,得到修正字符圖像,修正字符圖像內包含字符,其次基于字符的位置對字符圖像進行分割,得到結構字符圖像塊和非結構字符圖像塊,再對結構字符圖像塊進行字符識別,得到目標單字符,對非結構圖像塊進行字符識別,得到目標字符,最后對目標單字符和目標字符進行合并,得到目標數據。該方案對字符圖像進行修正,以及對字符圖像分割,并對分割得到的結構字符圖像塊和非結構圖像塊分別識別,提高了對字符識別的準確率。
技術領域
本申請涉及圖像處理技術領域,具體涉及一種字符識別方法、裝置、電子設備及存儲介質。
背景技術
隨著圖像處理技術的發展,字符識別作為該領域的重要應用,愈發受到重視。字符識別可以將存在于圖像等介質上的字符轉化為可通過電子設備編輯的字符形式。以公式識別為例,現有的公式識別方法,通常對公式圖像中的字符進行簡單分割得到若干單字符,并直接對該單字符進行識別,進而得到識別結果。由于公式內存在的字符粘連、及噪聲等因素的影響,導致通過現有技術進行公式識別的識別效果難以保證,識別準確率不高。
發明內容
本申請實施例提供一種字符識別方法、裝置、電子設備及存儲介質,旨在提高字符識別準確率。
本申請實施例提供的一種字符識別方法,包括:
獲取待檢測的字符圖像;
從所述字符圖像中提取特征信息;
根據所述特征信息對字符圖像修正處理,得到修正字符圖像,所述修正字符圖像內包含字符;
基于所述字符的位置對所述字符圖像進行分割,得到結構字符圖像塊和非結構字符圖像塊;
對所述結構字符圖像塊進行字符識別,得到目標單字符,以及對所述非結構圖像塊進行字符識別,得到目標字符;
對所述目標單字符和所述目標字符進行合并,得到目標數據。
在本申請的一些實施例中,所述字符圖像內包含特征,根據所述特征信息對字符圖像修正處理,得到修正字符圖像包括:
根據所述特征信息確定每個字符的候選外接矩形;
從所述候選外接矩形篩選出面積大于第一預設閾值的外接矩形,得到字符外接矩形;
獲取存在交集區域的字符外接矩形對,以及獲取交集區域與字符外接矩形對中的筆跡外接矩形之間的比值;
將所述比值大于第二預設閾值的字符外接矩形對進行合并,得到修正字符圖像。
在本申請的一些實施例中,所述字符包括結構字符和非結構字符,基于所述字符的位置對所述字符圖像進行分割,得到結構字符圖像和非結構字符圖像包括:
基于所述字符的位置檢測所述字符圖像中是否存在結構字符;
當所述字符圖像中存在結構字符時,根據所述結構字符的位置從所述字符圖像中提取結構字符區域,得到結構字符圖像;
根據所述結構字符的位置,將所述字符圖像中的結構字符區域替換為占位字符區域,得到非結構字符圖像。
在本申請的一些實施例中,基于所述字符的位置檢測所述字符圖像中是否存在結構字符之后,所述方法還包括:
當所述字符圖像中不存在結構字符時,通過預設識別模型對所述字符圖像進行字符識別。
在本申請的一些實施例中,所述占位字符區域內包含占位字符,所述對所述目標單字符和所述目標字符進行合并,得到目標數據包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911036151.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種水性聚氨酯底涂劑的合成方法
- 下一篇:一種新型爬壁機器人