[發明專利]一種基于存折、票據字符OCR識別方法和識別系統在審
| 申請號: | 202011482590.8 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112507914A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 孔飛;張文強;褚建民;李衛國 | 申請(專利權)人: | 江蘇國光信息產業股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/44;G06K9/46;G06K9/62 |
| 代理公司: | 常州易瑞智新專利代理事務所(普通合伙) 32338 | 代理人: | 徐琳淞 |
| 地址: | 213000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 存折 票據 字符 ocr 識別 方法 系統 | ||
1.一種基于存折、票據字符OCR識別方法,其特征在于,包括如下步驟:
步驟1、拍取的任意角度的存折圖像,通過預處理得到角度校正后的新存折圖像;
步驟2、對存折圖像的面向進行角度校正,調整至0°狀態;
步驟3、對校正后存折圖像中待識別區域的位置進行定位,并構建待識別區域的對應標簽;
步驟4、采用不定長OCR識別模型對待識別區域進行識別,并輸出識別結果。
2.根據權利要求1所述的基于存折、票據字符OCR識別方法,其特征在于,所述步驟1中的預處理方法包括如下步驟:
步驟11、獲取高拍儀拍取的任意角度的存折圖像;
步驟12、對存折圖像進行銳化和高斯平滑處理,增強圖像邊緣與周圍背景的反差;
步驟13、再利用算子檢測圖像邊緣,從橫向和縱向兩個方向與圖像做卷積操作,獲得梯度上的近似值后計算圖像輪廓,獲得的圖像輪廓以點集形式保存,計算輪廓點集的凸包和凸包的外接矩形,進而計算出輪廓的四個頂點坐標;
步驟14、通過透視變換對存在角度偏移的存折圖像進行校正,首先確定校正后新圖像的坐標,由新坐標與原本存折圖像坐標構建透視矩陣,透視矩陣為3×3矩陣,實現原圖像到新圖像的線性變換,平移變換和透視變換;
步驟15、存折圖像經透視矩陣變換后,即可獲得角度校正后的新圖像。
3.根據權利要求1所述的基于存折、票據字符OCR識別方法,其特征在于,所述步驟2中角度校正方法為:
利用訓練后的SVM分類器對透視變換后的圖片進行角度檢測,根據不同的檢測角度翻轉圖片,獲得圖片為0°狀態存折圖像。
4.根據權利要求3所述的基于存折、票據字符OCR識別方法,其特征在于,所述步驟2中SVM分類器的訓練方法,包括如下步驟:
步驟21、首先收集0°、90°、180°和270°翻轉的四種類型文本圖片預定數目;以SVM分類器對四種方向進行分類識別,構建圖片與對應分類的標簽,0°、90°、180°和270°分別對應標簽1、2、3和4;
步驟22、提取圖片的梯度直方圖HOG特征,所述HOG特征反應圖片的梯度變化信息,不同角度偏轉的文字梯度信息不同;
步驟23、采用主成分分析PCA方法對HOG特征降維;
步驟24、降維后的HOG特征作為輸入特征訓練SVM分類器,得到訓練后的SVM分類器。
5.根據權利要4所述的基于存折、票據字符OCR識別方法,其特征在于,所述主成分分析PCA方法,包括如下步驟:
步驟241、記共有s條d維HOG特征數據,將數據組合為s行d列的數據矩陣X;
步驟242、對矩陣每列計算其均值,組成1行d列矩陣X的每列減去其均值或是零均值化的新矩陣,記為X';
步驟243、計算新矩陣X'的協方差矩陣并計算其特征值和特征向量;
步驟244、將特征向量按對應特征值大小從上到下按行排列為矩陣,取前K行組成矩陣P,降維到K維的HOG特征矩陣為Y=PX。
6.根據權利要求1所述的基于存折、票據字符OCR識別方法,其特征在于,所述定位的方法為:以角度校正后存折圖像左上角頂點坐標為固定點,由于固定點位置與存折中所需提取信息區域的位置偏移關系固定,因此以固定點坐標加上偏移量定位到所需提取的各個區域坐標,將所述區域截取出來,即為識別區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇國光信息產業股份有限公司,未經江蘇國光信息產業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011482590.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種建筑工程造價預算專用工作臺
- 下一篇:一種筆記本印刷輥的清潔設備





