[發(fā)明專利]一種紙張字符識別方法、裝置、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010120584.1 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN111340040B | 公開(公告)日: | 2023-09-12 |
| 發(fā)明(設(shè)計)人: | 段勝業(yè);史忠偉 | 申請(專利權(quán))人: | 五八有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/164;G06V30/146 |
| 代理公司: | 北京弘權(quán)知識產(chǎn)權(quán)代理有限公司 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 300450 天津市濱海新區(qū)經(jīng)濟技術(shù)開*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 紙張 字符 識別 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本申請?zhí)峁┝艘环N紙張字符識別方法、裝置、電子設(shè)備及存儲介質(zhì),其中,首先,獲取帶有待識別字符的紙張的待識別圖像。然后,利用圖像目標定位模型,在所述待識別圖像中確定覆蓋所述待識別字符的第一區(qū)域圖像,并從所述待識別圖像中裁剪出所述第一區(qū)域圖像。之后對所述第一區(qū)域圖像做去噪聲處理,得到去噪圖像。最后,利用字符識別模型,識別所述去噪圖像中的待識別字符,得到識別結(jié)果。可見,本申請所提供的紙張字符識別方法可以通過對帶有待識別字符的圖像進行去噪處理,以消除圖像中的各種噪聲對字符識別準確性的影響,從而提高字符識別的準確度。
技術(shù)領(lǐng)域
本申請涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種紙張字符識別方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
通常為了在展示文字信息的同時增強閱讀的趣味性和觀賞性,會在展示文字信息用的紙質(zhì)文件、圖標等上增添背景圖案、邊框圖案等一些花樣效果。紙質(zhì)文件、圖標等的載體為紙張,由于紙張?zhí)烊痪哂幸灼鸢櫋⒁渍郫B、易臟污等特征,在需要大批量識別紙張上的字符或者紙張上的字符用肉眼難以分辨時,需要利用計算機對紙張進行字符識別。
通常會通過拍照或者掃描紙張的方法獲得待識別圖片,該待識別圖片上包含待識別字符,將這些待識別圖片上傳至計算機上之后,首先利用圖片裁剪工具將待識別圖片上包含待識別字符的字符區(qū)域裁剪下來,以縮小圖像識別的范圍。然后利用字符識別工具識別裁剪得到的字符區(qū)域內(nèi)的待識別字符。
但是,由上文可知,由于紙張本身的性質(zhì),待識別圖片會區(qū)別于理想化圖片,存在一些臟污、褶皺、歪曲、花紋干擾等噪聲,這些噪聲會嚴重影響字符識別的準確性。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N紙張字符識別方法,以提高字符識別的準確性。
第一方面,本申請?zhí)峁┝艘环N紙張字符識別方法,所述方法包括:
獲取帶有待識別字符的紙張的待識別圖像;
利用圖像目標定位模型,在所述待識別圖像中確定覆蓋所述待識別字符的第一區(qū)域圖像;
從所述待識別圖像中裁剪出所述第一區(qū)域圖像;
對所述第一區(qū)域圖像做去噪聲處理,得到去噪圖像;
利用字符識別模型,識別所述去噪圖像中的待識別字符,得到識別結(jié)果。
在本發(fā)明實施例第一方面一種可能的實現(xiàn)方式中,所述對第一區(qū)域圖像做去噪聲處理,得到去噪圖像包括:
利用角度回歸模型計算所述待識別字符在所述第一區(qū)域圖像中的傾斜角度,所述傾斜角度為所述待識別字符所在直線與水平方向的夾角;
將所述第一區(qū)域圖像旋轉(zhuǎn)與所述傾斜角度相等的角度,以使所述待識別字符所在直線與水平方向重合,得到校正后圖像;
利用邊框回歸模型對所述校正后圖像做邊框回歸處理,確定第二區(qū)域圖像,所述第二區(qū)域圖像為覆蓋全部所述待識別字符的最小矩形區(qū)域;
從所述第一區(qū)域圖像中裁剪出所述第二區(qū)域圖像;
對所述第二區(qū)域圖像做去噪聲處理,得到去噪圖像。
在本發(fā)明實施例第一方面一種可能的實現(xiàn)方式中,所述對第二區(qū)域圖像做去噪聲處理,得到去噪圖像包括:
對所述第二區(qū)域圖像做二值化處理,以使所述第二區(qū)域圖像中的各個像素點的像素值轉(zhuǎn)化為0或255,得到二值化圖像;
對所述二值化圖像做去噪聲處理,得到去噪圖像。
在本發(fā)明實施例第一方面一種可能的實現(xiàn)方式中,所述對二值化圖像做去噪聲處理,得到去噪圖像包括:
確定所述二值化圖像中的第一問題像素點,所述問題像素點為像素值連續(xù)相等的數(shù)量小于預(yù)設(shè)數(shù)量閾值的像素點;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于五八有限公司,未經(jīng)五八有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010120584.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





