[發明專利]一種基于行列切分的印刷體字符的識別方法有效
| 申請號: | 202010705900.1 | 申請日: | 2020-07-21 |
| 公開(公告)號: | CN111931778B | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 胡焱;趙亞歐;郭繼東;牛鵬 | 申請(專利權)人: | 浪潮金融信息技術有限公司;濟南浪潮金迪信息科技有限公司 |
| 主分類號: | G06V30/22 | 分類號: | G06V30/22;G06V30/148;G06V30/18;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 蘇州思睿晶華知識產權代理事務所(普通合伙) 32403 | 代理人: | 吳碧駿 |
| 地址: | 215000 江蘇省蘇州市吳中經*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 行列 切分 印刷體 字符 識別 方法 | ||
本發明公開了一種基于行列切分的印刷體字符的識別方法,對于圖像進行列切分,對于列切分后的切片,再次進行行切分;將行列切分后的圖像切片送入卷積神經網絡,進行特征提取,得到切片對應的特征向量;對于空白切片,則在識別過程中,忽略這部分空白切片;對于存在文字部分的切片,使用循環神經網絡模型學習這些切片的前后關聯關系,經過softmax激勵得到每列切片對應文字的預測概率,利用CTC算法處理每列切片的文字預測概率,進而確定所識別的文字。通過上述方式,本發明能夠同時利用行、列兩個維度的信息,所獲得的文字特征更加豐富,識別率高。
技術領域
本發明涉及字符識別技術領域,特別是涉及一種基于行列切分的印刷體字符的識別方法。
背景技術
字符識別能夠自動識別和提取圖片中的文字,已廣泛應用于紙質文件的電子化歸檔、不含芯片的證照信息讀取等領域。當前,該領域的主流技術是深度學習技術,識別流程為:首先按行提取圖片中的文字,然后按列對整行文字進行切分,最后將每一個切片送入深度學習模型識別并輸出結果。
然而,傳統方法對提取后的文字區域只進行列切分,即將一行文字劃分為多個列切片,這種方法僅適用于文字大小相同,且處于同一水平線上的情況。對于藝術字體,處于同一行的文字大小不盡相同,如果按最大文字高度進行列切分,則較小的文字占整個切片區域的比例較小,影響后續的識別。此外,由于廣告文字排版的隨意性,即使是同樣大小的文字,也可能傾斜或者旋轉排列,如果僅進行列切分,文字在不同切片中的位置是變化的,也會影響后續的識別。
發明內容
本發明主要解決的技術問題是提供一種基于行列切分的印刷體字符的識別方法,能夠在列切分的基礎上進行行切分,可同時利用行、列兩個維度的信息,所獲得的文字特征更加豐富,后續識別率更高。
為解決上述技術問題,本發明采用的一個技術方案是:提供一種基于行列切分的印刷體字符的識別方法,包括:對于圖像進行列切分,對于列切分后的切片,再次進行行切分;將行列切分后的圖像切片送入卷積神經網絡,進行特征提取,得到切片對應的特征向量;對于空白切片,則在識別過程中,忽略這部分空白切片;對于存在文字部分的切片,使用循環神經網絡模型學習這些切片的前后關聯關系,經過softmax激勵得到每列切片對應文字的預測概率,利用CTC算法處理每列切片的文字預測概率,進而確定所識別的文字。
一種基于行列切分的印刷體字符的識別方法,具體包括以下步驟:
步驟一、利用行文本檢測算法,檢測并裁剪圖片中的行文本區域;
步驟二、對于每一個行文本區域,以固定寬度按列進行切分,形成列切片;
步驟三、對于每一個列切片,以固定高度按行進行二次切分,形成行切片;
步驟四、將按行列切分后的每一個的圖像切片送入卷積神經網絡,進行特征提取,得到切片對應的特征向量;
步驟五、從第一個列切片開始,將其包含的每一個行切片的特征向量送入循環神經網絡,然后取循環神經網絡的最后一個輸出作為當前狀態計算下一列;同時,該輸出經過softmax激勵,得到該列切片對應文字的預測概率;重復該過程,直到最后一個列切片計算完成為止;
步驟六、利用CTC算法處理每個列切片的文字預測概率,得到最終的文字識別結果。
進一步,所述步驟一中行文本檢測算法包括CPTN、Yolo、PixelLink。
進一步,所述步驟二中列切分寬度為4個像素,所述步驟三中行切分高度為4個像素。
本發明的有益效果是:本發明可有效解決文字大小不均、非水平排列的情況下識別率低的問題。本發明在列切分的基礎上進行行切分,可同時利用行、列兩個維度的信息,與單純使用列切分方法相比,所獲得的文字特征更加豐富,后續識別率更高。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮金融信息技術有限公司;濟南浪潮金迪信息科技有限公司,未經浪潮金融信息技術有限公司;濟南浪潮金迪信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010705900.1/2.html,轉載請聲明來源鉆瓜專利網。





