[發明專利]一種字符識別方法及系統有效
| 申請號: | 201910594297.1 | 申請日: | 2019-07-03 |
| 公開(公告)號: | CN110298353B | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 李紅波;張然;趙存超;杜俊 | 申請(專利權)人: | 中國農業銀行股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/38;G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王小清 |
| 地址: | 100005 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 識別 方法 系統 | ||
1.一種字符識別方法,其特征在于,包括:
獲取待識別圖片;
提取所述待識別圖片的圖片特征,利用所述待識別圖片的圖片特征,對所述待識別圖片的圖片類型進行識別,從所述待識別圖片中篩選出與預設圖片類型對應的待識別圖片,作為基準圖片;
確定所述基準圖片中的待識別字符文本框在所述基準圖片中的位置;所述確定所述基準圖片中的待識別字符文本框在所述基準圖片中的位置的過程包括:將所述基準圖片投影到二維坐標平面中;確定所述基準圖片中的待識別字符文本框的四個頂點在所述基準圖片中的二維坐標值;
其中,在確定所述基準圖片中的待識別字符文本框在所述基準圖片中的位置之前,還包括:
將所述基準圖片映射到二維坐標系中;
在X軸方向上,統計所述基準圖片中每列像素點中像素值大于預設像素值的像素點的個數,將每列像素點中像素值大于預設像素值的像素點的個數作為X軸方向上一維點集的元素坐標值;
沿著X軸從原點到遠端的方向,將X軸方向上一維點集的元素坐標值小于預設元素坐標值的相鄰元素坐標值劃分到一組中,得到第一元素組,將X軸方向上一維點集的元素坐標值大于或等于預設元素坐標值的相鄰元素坐標值劃分到另一組中,得到第二元素組;
將任一第一元素組在X軸方向上的起始坐標值與終止坐標值作為所述基準圖片在X軸方向上的分割點;
在Y軸方向上,統計所述基準圖片中每行像素點中像素值大于預設像素值的像素點的個數,將每行像素點中像素值大于預設像素值的像素點的個數作為Y軸方向上一維點集的元素坐標值;
沿著Y軸從原點到遠端的方向,將Y軸方向上一維點集的元素坐標值小于預設元素坐標值的相鄰元素坐標值劃分到一組中,得到第三元素組,將Y軸方向上一維點集的元素坐標值大于或等于預設元素坐標值的相鄰元素坐標值劃分到另一組中,得到第四元素組;
將任一第三元素組在Y軸方向上的起始坐標值與終止坐標值作為所述基準圖片在Y軸方向上的分割點;
利用所述基準圖片在X軸方向上的分割點,得到所述基準圖片在X軸方向上的分割線,利用所述基準圖片在Y軸方向上的分割點,得到所述基準圖片在Y軸方向上的分割線;
利用所述基準圖片在X軸方向上的分割線以及所述基準圖片在Y軸方向上的分割線,對所述基準圖片進行切分,得到所述基準圖片對應的切分圖片;
依據所述位置,在所述基準圖片中定位到所述待識別字符文本框,并對所述待識別字符文本框中的字符內容進行識別,得到字符內容識別結果;
確定與所述字符內容識別結果對應的字符內容屬性信息;
將所述待識別字符文本框在所述基準圖片中的位置、所述待識別字符文本框對應的字符內容識別結果以及字符內容屬性信息進行匹配輸出。
2.根據權利要求1所述的方法,其特征在于,在將所述基準圖片映射到二維坐標系中之前,還包括:
對所述基準圖片進行灰化處理,得到灰化處理后的基準圖片;
將灰化處理后的基準圖片的像素值進行二值化處理,得到二值化處理后的基準圖片;
對所述二值化處理后的基準圖片進行圖形特征處理,得到圖形特征處理后的基準圖片。
3.根據權利要求1所述的方法,其特征在于,在得到所述基準圖片對應的切分圖片之后,還包括:
對所述切分圖片進行預設角度的旋轉,使得所述切分圖片中的文字方向處于預設方向。
4.根據權利要求1所述的方法,其特征在于,所述確定所述基準圖片中的待識別字符文本框在所述基準圖片中的位置的過程包括:
將所述基準圖片投影到二維坐標平面中;
確定所述基準圖片中的待識別字符文本框的四個頂點在所述基準圖片中的二維坐標值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業銀行股份有限公司,未經中國農業銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910594297.1/1.html,轉載請聲明來源鉆瓜專利網。





