[發明專利]構建字符識別模型與識別字符的方法和裝置有效
| 申請號: | 201910477704.0 | 申請日: | 2019-06-03 |
| 公開(公告)號: | CN110222693B | 公開(公告)日: | 2022-03-08 |
| 發明(設計)人: | 韓景濤;曾華榮;韓鋒 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06N3/04;G06N3/08 |
| 代理公司: | 北京展翼知識產權代理事務所(特殊普通合伙) 11452 | 代理人: | 王明遠 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 構建 字符 識別 模型 方法 裝置 | ||
1.一種基于字符識別模型識別圖片中字符的方法,其中,所述字符識別模型包括特征提取模塊和識別模塊,所述方法包括:
將預測圖片輸入特征提取模塊,得到所述特征提取模塊輸出的特征矩陣;其中,所述特征提取模塊包括第一特征提取網絡結構或者第二特征提取網絡結構;所述第一特征提取網絡結構包括至少一層第一特征提取單元,所述第一特征提取單元由依次連接的第一卷積層、第一激活函數層、第二卷積層、第一批標準化層、第二激活函數層以及第一池化層組成;所述第二特征提取網絡結構包括至少一層第二特征提取單元,所述第二特征提取單元由依次連接的第三卷積層、第三激活函數層、第四卷積層、第四激活函數層、第二批標準化層以及第二池化層組成,所述第一特征提取網絡結構適用于字符解空間大于第一預定閾值的場景,所述第二特征提取網絡結構適用于字符解空間小于第二預定閾值的場景,所述第一預定閾值大于或等于所述第二預定閾值,所述字符解空間是指需要識別的字符的集合;
將所述特征矩陣輸入所述識別模塊,得到所述識別模塊輸出的字符識別結果,所述識別模塊包括概率生成單元和解碼單元,所述將所述特征矩陣輸入所述識別模塊,得到所述識別模塊輸出的字符識別結果的步驟包括:將所述特征矩陣輸入所述概率生成單元,以得到概率矩陣,其中,所述概率矩陣中的每個列向量用于表征所述預測圖片中的一塊區域所包含的字符的概率分布,所述列向量中的每個元素對應于一個字符,元素的取值用于表征該區域包含的字符是該元素所對應的字符的概率,所述概率矩陣中列向量的維度與字符解空間的大小相當;將所述概率矩陣輸入所述解碼單元,得到所述解碼單元生成的所述預測圖片包含的字符的識別結果。
2.根據權利要求1所述的方法,其中,
在所述第一特征提取網絡結構包括至少兩層第一特征提取單元的情況下,在后的第一特征提取單元中卷積層中的卷積核的個數是在前的第一特征提取單元中卷積層中的卷積核的個數的M倍,其中M≥2,并且/或者
在所述第二特征提取網絡結構包括至少兩層第二特征提取單元的情況下,在后的第二特征提取單元中卷積層中的卷積核的個數是在前的第二特征提取單元中卷積層中的卷積核的個數的N倍,其中N≥2。
3.根據權利要求1所述的方法,其中,所述將所述特征矩陣輸入所述概率生成單元,以得到概率矩陣的步驟包括:
所述概率生成單元為循環神經網絡結構,將所述特征矩陣中的列向量依次輸入循環神經網絡結構,以得到由所述循環神經網絡結構輸出的概率矩陣。
4.根據權利要求3所述的方法,其中,
所述循環神經網絡結構的隱藏層中神經元的個數是根據所述字符解空間的大小設定的,并且/或者
所述循環神經網絡結構的輸出層中神經元的個數與所述字符解空間的大小之間的差值的絕對值小于第三預定閾值。
5.根據權利要求4所述的方法,其中,
所述循環神經網絡結構的隱藏層中神經元的個數與所述字符解空間的大小正相關。
6.根據權利要求4所述的方法,其中,
在所述循環神經網絡結構的輸出層中神經元的個數與所述循環神經網絡結構的隱藏層中神經元的個數之間的數量差異大于第四預定閾值的情況下,在所述隱藏層和所述輸出層之間設置一層全連接層,所述全連接層中神經元的個數與所述字符解空間的大小之間的差值的絕對值小于第五預定閾值。
7.根據權利要求3所述的方法,其中,
所述循環神經網絡結構由兩層雙向循環神經網絡構成。
8.根據權利要求1所述的方法,其中,所述將所述概率矩陣輸入所述解碼單元,得到所述解碼單元生成的所述預測圖片包含的字符的識別結果步驟包括:
所述解碼單元計算所述概率矩陣所有可能的解碼路徑的概率之和;
選取概率之和最大的解碼路徑,作為所述預測圖片所包含的字符的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910477704.0/1.html,轉載請聲明來源鉆瓜專利網。





