[發明專利]一種字符識別方法、裝置、設備及可讀存儲介質在審
| 申請號: | 202110942584.4 | 申請日: | 2021-08-17 |
| 公開(公告)號: | CN113642477A | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 張召;鄭歡;張莉;王邦軍 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王曉坤 |
| 地址: | 215131 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 識別 方法 裝置 設備 可讀 存儲 介質 | ||
1.一種字符識別方法,其特征在于,包括:
采集原始字符圖像,生成訓練樣本;
構建字符識別模型;所述字符識別模型包括用于利用輕量級密集塊提取特征的壓縮密集神經網絡、用于對提取到的特征進行耦合處理的耦合壓縮密集特征流卷積網絡,以及用于對處理后的特征進行預測,并將預測結果轉換為文字輸出的轉錄模塊;所述輕量級密集塊為同時使用求和操作和串聯操作將每個密集塊中的內部特征組合在一起的卷積塊;
采用所述訓練樣本對構建的所述字符識別模型進行訓練;
將待處理字符圖像輸入至訓練完成的所述字符識別模型進行處理,輸出字符識別結果。
2.根據權利要求1所述的字符識別方法,其特征在于,所述壓縮密集神經網絡包括用于對輸入圖像進行卷積和下采樣并輸出密集特征的編碼模塊;
所述編碼模塊包括一個卷積層、三個所述輕量級密集塊和兩個過渡層。
3.根據權利要求2所述的字符識別方法,其特征在于,所述壓縮密集神經網絡還包括用于對所述密集特征進行優化處理并輸出上采樣特征的上采樣模塊;所述上采樣模塊使用反卷積構造而成;
所述上采樣模塊包括上采樣操作、兩個所述輕量級密集塊、一個過渡層和一個卷積層。
4.根據權利要求3所述的字符識別方法,其特征在于,所述壓縮密集神經網絡采用深度可分離卷積進行卷積操作。
5.根據權利要求4所述的字符識別方法,其特征在于,所述耦合壓縮密集特征流卷積網絡包括用于增強所述輕量級密集塊中不同層之間的特征流和耦合的耦合輕量級密集塊;
所述耦合輕量級密集塊包括三個卷積層、兩個所述輕量級密集塊和一個過渡層;
第一個所述輕量級密集塊與第二個卷積層通過串聯短連接;
第二個所述輕量級密集塊與第三個卷積層通過串聯短連接。
6.根據權利要求5所述的字符識別方法,其特征在于,所述耦合壓縮密集特征流卷積網絡包括兩個所述耦合輕量級密集塊;
第一個所述耦合輕量級密集塊中的過渡層作為第二個所述耦合輕量級密集塊中的第一個卷積層。
7.根據權利要求6所述的字符識別方法,其特征在于,所述對處理后的特征進行預測,包括:
將處理后的特征輸入softmax分類器進行字符預測,得到預測結果。
8.一種字符識別裝置,其特征在于,包括:
圖像采集模塊,用于采集原始字符圖像,生成訓練樣本;
模型構建模塊,用于構建字符識別模型;所述字符識別模型包括用于利用輕量級密集塊提取特征的壓縮密集神經網絡、用于對提取到的特征進行耦合處理的耦合壓縮密集特征流卷積網絡,以及用于對處理后的特征進行預測,并將預測結果轉換為文字輸出的轉錄模塊;所述輕量級密集塊為同時使用求和操作和串聯操作將每個密集塊中的內部特征組合在一起的卷積塊;
模型訓練模塊,用于采用所述訓練樣本對構建的所述字符識別模型進行訓練;
字符識別模塊,用于將待處理字符圖像輸入至訓練完成的所述字符識別模型進行處理,輸出字符識別結果。
9.一種字符識別設備,其特征在于,包括處理器和存儲器,其中,所述處理器執行所述存儲器中存儲的計算機程序時實現如權利要求1至7任一項所述的字符識別方法。
10.一種計算機可讀存儲介質,其特征在于,用于存儲計算機程序,其中,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述的字符識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110942584.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自助式寄件柜支付系統及方法
- 下一篇:一種智能運維平臺





