[發明專利]一種基于OCR的多票據自動識別方法及識別系統在審
| 申請號: | 201911192294.1 | 申請日: | 2019-11-28 |
| 公開(公告)號: | CN111008635A | 公開(公告)日: | 2020-04-14 |
| 發明(設計)人: | 章玨 | 申請(專利權)人: | 的盧技術有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06K9/22 |
| 代理公司: | 南京禹為知識產權代理事務所(特殊普通合伙) 32272 | 代理人: | 王曉東 |
| 地址: | 211103 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ocr 票據 自動識別 方法 識別 系統 | ||
1.一種基于OCR的多票據自動識別方法,其特征在于:包括以下步驟,
獲取OCR的票據樣本;
圖像采集模塊(100)采集待識別的票據圖像;
所述票據圖像輸入圖像預處理模塊(200)中處理得到次級圖像;
去嘈雜模塊(300)將所述次級圖像去嘈雜后獲得標準圖像;
所述標準圖像輸入票據識別模塊(400)內進行檢測完成識別。
2.如權利要求1所述的基于OCR的多票據自動識別方法,其特征在于:所述圖像預處理模塊(200)包括以下預處理步驟,
將所述票據圖像旋轉或透視縮放;
旋轉或透視縮放后將所述票據圖像中的文字沿水平垂直方向對齊;
經對齊的圖像進行剪裁得到所述次級圖像。
3.如權利要求1或2所述的基于OCR的多票據自動識別方法,其特征在于:所述去嘈雜模塊(300)包括以下步驟,
對所述次級圖像進行去色處理;
調整所述次級圖像的直方圖信息;
保留淺色區域中的淺色像素和深色區域中的深色像素;
獲得高反差樣本的所述標準圖像。
4.如權利要求3所述的基于OCR的多票據自動識別方法,其特征在于:所述票據識別模塊(400)包括以下識別處理步驟,
包含待識別字符的所述標準圖像進行分析結構;
運用閾值對待測對象進行去噪和矯正;
對文本信息做行列分割;
將分割后的字符圖像導入識別模型中進行處理得到原圖中的字符信息。
5.如權利要求1~2或4任一所述的基于OCR的多票據自動識別方法,其特征在于:所述識別模型采用CTPN算法模型,包括以下識別步驟,
對復雜場景內橫排的文字分割成的不同單元塊檢測;
加入豎直Anchor檢測豎直文字;
利用雙向LSTM層學習圖像中的空間特征及序列特征;
使用正則表達來查找票據圖像中的每個字符對應含義。
6.如權利要求5所述的基于OCR的多票據自動識別方法,其特征在于:所述文字分割包括以下步驟,
通過圖像非均勻分割方法對單個文字進行切割;
利用函數得出每個字符的寬度,在多個近似分類中選出切分合適的一組;
使用CNN算法模型對分類后這組字符進行識別辨認。
7.如權利要求6所述的基于OCR的多票據自動識別方法,其特征在于:所述CTPN算法模型包括以下步驟,
用VGG16的前5個Convstage得到feature map,大小為W*H*C;
用3*3的滑動窗口在所述feature map上提取特征;
利用提取的特征來對多個anchor界定出的目標待選區域進行預測;
將提取的特征輸入值雙向的LSTM層中輸出W*256的結果;
再將所述結果輸入到至512維的全連接層;
最后通過分類或回歸得到識別后的輸出。
8.如權利要求7所述的基于OCR的多票據自動識別方法,其特征在于:所述輸出包括選擇框的高度和中心的y軸的坐標、k個anchor的類別信息、選擇框的水平偏移量;所述類別信息能夠說明其是否為字符。
9.如權利要求8所述的基于OCR的多票據自動識別方法,其特征在于:所述圖像預處理模塊(200)包括以下步驟,
經統一尺寸、對齊獲得所述次級圖像;
所述次級圖像設定一個全局的閾值T;
用T將圖像的數據分成兩部分,包括大于T的像素群和小于T的像素群;
將大于T的像素群的像素值設定為白色和小于T的像素群的像素值設定為黑色。
10.一種基于OCR的多票據自動識別系統,其特征在于:包括圖像采集模塊(100)、圖像預處理模塊(200)、去嘈雜模塊(300)和票據識別模塊(400);
所述圖像采集模塊(100)用于采集待識別的票據圖像;
所述圖像預處理模塊(200)用于處理采集的圖像獲得次級圖像;
所述去嘈雜模塊(300)用于將所述次級圖像去嘈雜后獲得標準圖像;
所述票據識別模塊(400)用于檢測識別所述標準圖像生成識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于的盧技術有限公司,未經的盧技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911192294.1/1.html,轉載請聲明來源鉆瓜專利網。





