[發明專利]一種字符識別方法、裝置、設備及可讀存儲介質在審
| 申請號: | 202110942584.4 | 申請日: | 2021-08-17 |
| 公開(公告)號: | CN113642477A | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 張召;鄭歡;張莉;王邦軍 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王曉坤 |
| 地址: | 215131 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 識別 方法 裝置 設備 可讀 存儲 介質 | ||
本申請公開了一種字符識別方法、裝置、設備及可讀存儲介質,該方法包括:采集原始字符圖像,生成訓練樣本;構建字符識別模型;該模型包括用于利用輕量級密集塊提取特征的壓縮密集神經網絡、用于對提取到的特征進行耦合處理的耦合壓縮密集特征流卷積網絡,以及用于對處理后的特征進行預測,并將預測結果轉換為文字輸出的轉錄模塊;輕量級密集塊為同時使用求和操作和串聯操作將每個密集塊中的內部特征組合在一起的卷積塊;采用訓練樣本對該模型進行訓練;將待處理字符圖像輸入至訓練完成的模型進行處理,輸出字符識別結果。這樣利用輕量級密集塊可以捕獲到深層次的結構特征用于字符識別,進而減少計算成本和權重大小,有效提升字符的識別能力。
技術領域
本發明涉及圖像識別技術領域,特別是涉及一種字符識別方法、裝置、設備及可讀存儲介質。
背景技術
文本和圖像是計算機視覺領域中最流行的兩種視覺數據,在實踐中,通常總是將文本嵌入圖像中,因此,如何通過學習算法準確地檢測和識別圖像中的文本或字符仍然是具有挑戰性的,并且是視覺和模式識別領域中的重要課題,例如光學字符識別(OpticalCharacter Recognition,OCR)。由于背景復雜且圖像內容復雜,因此OCR仍然是一項非常具有挑戰性的任務。
對于OCR,兩個關鍵的子任務是文本行提取和文本行識別:第一個任務是提取圖像中文本的區域,第二個任務是識別已提取區域的文本內容。為了處理OCR,目前有兩個主流框架:第一個是訓練一個端到端網絡,該網絡可以共同解決文本行提取和識別的任務,例如任意方向網絡,雖然統一網絡模型的適應性較強和速度較快,但字符識別結果準確率略低;另一種流行的方案是兩階段方案,即為兩個子任務訓練兩個網絡,例如卷積遞歸神經網絡(Convolutional Recurrent Neural Network,CRNN),雖然兩階段模型通常具有較高的字符識別準確性,但效率較低,計算成本高,計算量大,同時需要更多的空間去保存權重,從而限制了密集塊的深度。
發明內容
有鑒于此,本發明的目的在于提供一種字符識別方法、裝置、設備及可讀存儲介質,可以減少計算成本和權重大小,有效提升字符識別能力。其具體方案如下:
一種字符識別方法,包括:
采集原始字符圖像,生成訓練樣本;
構建字符識別模型;所述字符識別模型包括用于利用輕量級密集塊提取特征的壓縮密集神經網絡、用于對提取到的特征進行耦合處理的耦合壓縮密集特征流卷積網絡,以及用于對處理后的特征進行預測,并將預測結果轉換為文字輸出的轉錄模塊;所述輕量級密集塊為同時使用求和操作和串聯操作將每個密集塊中的內部特征組合在一起的卷積塊;
采用所述訓練樣本對構建的所述字符識別模型進行訓練;
將待處理字符圖像輸入至訓練完成的所述字符識別模型進行處理,輸出字符識別結果。
優選地,在本發明實施例提供的上述字符識別方法中,所述壓縮密集神經網絡包括用于對輸入圖像進行卷積和下采樣并輸出密集特征的編碼模塊;
所述編碼模塊包括一個卷積層、三個所述輕量級密集塊和兩個過渡層。
優選地,在本發明實施例提供的上述字符識別方法中,所述壓縮密集神經網絡還包括用于對所述密集特征進行優化處理并輸出上采樣特征的上采樣模塊;所述上采樣模塊使用反卷積構造而成;
所述上采樣模塊包括上采樣操作、兩個所述輕量級密集塊、一個過渡層和一個卷積層。
優選地,在本發明實施例提供的上述字符識別方法中,所述壓縮密集神經網絡采用深度可分離卷積進行卷積操作。
優選地,在本發明實施例提供的上述字符識別方法中,所述耦合壓縮密集特征流卷積網絡包括用于增強所述輕量級密集塊中不同層之間的特征流和耦合的耦合輕量級密集塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110942584.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自助式寄件柜支付系統及方法
- 下一篇:一種智能運維平臺





