[發明專利]一種紙張字符識別方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010120584.1 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN111340040B | 公開(公告)日: | 2023-09-12 |
| 發明(設計)人: | 段勝業;史忠偉 | 申請(專利權)人: | 五八有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/164;G06V30/146 |
| 代理公司: | 北京弘權知識產權代理有限公司 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 300450 天津市濱海新區經濟技術開*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 紙張 字符 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種紙張字符識別方法,其特征在于,所述方法包括:
獲取帶有待識別字符的紙張的待識別圖像,所述待識別字符的最小矩形區域的尺寸不固定,其中,所述最小矩形區域是所述待識別字符按照傾斜角度旋轉校正之后對應的矩形區域;
利用圖像目標定位模型,在所述待識別圖像中確定覆蓋所述待識別字符的第一區域圖像,所述第一區域圖像對應的區域為呈水平狀態的矩形區域,其中,所述矩形區域的左上角坐標以及右下角坐標基于所述待識別字符確定;
從所述待識別圖像中裁剪出所述第一區域圖像;
對按照所述傾斜角度旋轉后的所述第一區域圖像中的第二區域圖像做去噪聲處理,得到去噪圖像,所述第二區域圖像是與所述最小矩形區域對應的圖像,所述第二區域圖像為二值化圖像,所述去噪圖像是從所述第二區域圖像中剔除第一問題像素點,和/或對第二問題像素點所形成的像素區域做膨脹處理得到的,其中,所述第一問題像素點為像素值連續相等的數量小于預設數量閾值的像素點,所述第二問題像素點為像素值連續相等的數量大于或者等于預設數量閾值,且所述第二問題像素點所形成的像素區域的寬度小于預設寬度閾值;
利用字符識別模型,識別所述去噪圖像中每個子區域圖像的待識別字符,得到識別結果,所述子區域圖像為將所述去噪圖像按照預設分割標識分割獲得,所述子區域圖像包括至少一個待識別字符,其中,所述預設分割標識為字符之間超過預設寬度的空白、標點符號或者字符數量。
2.根據權利要求1所述的方法,其特征在于,所述對按照所述傾斜角度旋轉后的所述第一區域圖像中的第二區域圖像做去噪聲處理,得到去噪圖像包括:
利用角度回歸模型計算所述待識別字符在所述第一區域圖像中的所述傾斜角度,所述傾斜角度為所述待識別字符所在直線與水平方向的夾角;
將所述第一區域圖像旋轉與所述傾斜角度相等的角度,以使所述待識別字符所在直線與水平方向重合,得到校正后圖像;
利用邊框回歸模型對所述校正后圖像做邊框回歸處理,確定所述第二區域圖像;
從所述第一區域圖像中裁剪出所述第二區域圖像;
對所述第二區域圖像做去噪聲處理,得到去噪圖像。
3.根據權利要求2所述的方法,其特征在于,所述對第二區域圖像做去噪聲處理,得到去噪圖像包括:
對所述第二區域圖像做二值化處理,以使所述第二區域圖像中的各個像素點的像素值轉化為0或255,得到二值化圖像;
對所述二值化圖像做去噪聲處理,得到去噪圖像。
4.根據權利要求3所述的方法,其特征在于,所述對二值化圖像做去噪聲處理,得到去噪圖像包括:
確定所述二值化圖像中的所述第一問題像素點;
從所述二值化圖像中剔除所述第一問題像素點,得到去噪圖像。
5.根據權利要求3所述的方法,其特征在于,所述對二值化圖像做去噪聲處理,得到去噪圖像包括:
確定所述二值化圖像中的所述第二問題像素點;
對所述第二問題像素點所形成的像素區域做膨脹處理,以使所述二值化圖像中的所述像素區域的寬度大于或者等于預設寬度閾值,得到去噪圖像。
6.根據權利要求4或5所述的方法,其特征在于,所述利用字符識別模型,識別所述去噪圖像中的待識別字符,得到識別結果包括:
按照所述預設分割標識,將所述去噪圖像分割為多個所述子區域圖像;
利用字符識別模型依次識別每一所述子區域圖像中的待識別字符,得到子識別結果;
按照所述待識別字符在所述待識別圖像中的位置順序,連接各所述子識別結果,得到識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于五八有限公司,未經五八有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010120584.1/1.html,轉載請聲明來源鉆瓜專利網。





