[發(fā)明專利]一種基于存折、票據(jù)字符OCR識別方法和識別系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011482590.8 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112507914A | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計)人: | 孔飛;張文強;褚建民;李衛(wèi)國 | 申請(專利權(quán))人: | 江蘇國光信息產(chǎn)業(yè)股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/44;G06K9/46;G06K9/62 |
| 代理公司: | 常州易瑞智新專利代理事務(wù)所(普通合伙) 32338 | 代理人: | 徐琳淞 |
| 地址: | 213000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 存折 票據(jù) 字符 ocr 識別 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于存折、票據(jù)字符OCR識別方法和識別系統(tǒng),屬于模式識別與計算機視覺技術(shù)領(lǐng)域。包括如下步驟:步驟1、拍取的任意角度的存折圖像,通過預處理得到角度校正后的新存折圖像;步驟2、對存折圖像的面向進行角度校正,調(diào)整至0°狀態(tài);步驟3、對校正后存折圖像中待識別區(qū)域的位置進行定位,并構(gòu)建待識別區(qū)域的對應(yīng)標簽;步驟4、采用不定長OCR識別模型對待識別區(qū)域進行識別,并輸出識別結(jié)果。本發(fā)明通過OCR識別實現(xiàn)存折信息自動提取,減少了人工核驗信息和錄入信息的時間成本和人工成本,大大提高工作效率;通過采用深度學習模型進行OCR識別,加快了信息識別速度和識別準確率,針對不同印刷字體具有較高的魯棒性。
技術(shù)領(lǐng)域
本發(fā)明屬于模式識別與計算機視覺技術(shù)領(lǐng)域,尤其是一種基于存折、票據(jù)字符OCR識別方法和識別系統(tǒng)。
背景技術(shù)
近年來計算機視覺技術(shù)快速發(fā)展,圖片文字的OCR識別成為熱門方向,目前對于自然場景和金融票據(jù)等復雜背景下的OCR識別研究較多,且已經(jīng)有成熟的應(yīng)用,自動化的識別大大提高了工作效率。本專利針對銀行存折信息提取方面效率低下,人工提取信息準確率降低等問題設(shè)計自動化的存折信息提取系統(tǒng)。
申請人通過長期的實踐和研究,發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:1、存折信息提取采用人工方式效率較低,且人工方式隨時間增長準確率也會降低。2、目前已有OCR識別系統(tǒng)針對不同應(yīng)用場景的兼容性不高,對進行識別文字圖片偏移角度和圖片質(zhì)量要求較高,還需人工固定方向采集待識別圖片。
發(fā)明內(nèi)容
發(fā)明目的:提供一種基于存折、票據(jù)字符OCR識別方法和識別系統(tǒng),以解決背景技術(shù)中所涉及的問題。
技術(shù)方案:一種基于存折、票據(jù)字符OCR識別方法,包括如下步驟:
步驟1、拍取的任意角度的存折圖像,通過預處理得到角度校正后的新存折圖像;
步驟2、對存折圖像的面向進行角度校正,調(diào)整至0°狀態(tài);
步驟3、對校正后存折圖像中待識別區(qū)域的位置進行定位,并構(gòu)建待識別區(qū)域的對應(yīng)標簽;
步驟4、采用不定長OCR識別模型對待識別區(qū)域進行識別,并輸出識別結(jié)果。
進一步地,所述步驟1中的預處理方法包括如下步驟:
步驟11、獲取高拍儀拍取的任意角度的存折圖像;
步驟12、對存折圖像進行銳化和高斯平滑處理,增強圖像邊緣與周圍背景的反差;
步驟13、再利用Sobel算子檢測圖像邊緣,從橫向和縱向兩個方向與圖像做卷積操作,獲得梯度上的近似值后計算圖像輪廓,獲得的圖像輪廓以點集形式保存,計算輪廓點集的凸包和凸包的外接矩形,進而計算出輪廓的四個頂點坐標;
步驟14、通過透視變換對存在角度偏移的存折圖像進行校正,首先確定校正后新圖像的坐標,由新坐標與原本存折圖像坐標構(gòu)建透視矩陣,透視矩陣為3×3矩陣,實現(xiàn)原圖像到新圖像的線性變換,平移變換和透視變換;
步驟15、存折圖像經(jīng)透視矩陣變換后,即可獲得角度校正后的新圖像。
進一步地,所述步驟2中角度校正方法為:
利用訓練后的SVM分類器對透視變換后的圖片進行角度檢測,根據(jù)不同的檢測角度翻轉(zhuǎn)圖片,獲得圖片為0°狀態(tài)存折圖像。
進一步地,所述步驟2中SVM分類器的訓練方法,包括如下步驟:
步驟21、首先收集0°、90°、180°和270°翻轉(zhuǎn)的四種類型文本圖片預定數(shù)目;以SVM分類器對四種方向進行分類識別,構(gòu)建圖片與對應(yīng)分類的標簽,0°、90°、180°和270°分別對應(yīng)標簽1、2、3和4;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇國光信息產(chǎn)業(yè)股份有限公司,未經(jīng)江蘇國光信息產(chǎn)業(yè)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011482590.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





