[發(fā)明專利]字符識別模型的訓練方法及裝置、字符識別方法及裝置在審
| 申請?zhí)枺?/td> | 201911347934.1 | 申請日: | 2019-12-24 |
| 公開(公告)號: | CN111435445A | 公開(公告)日: | 2020-07-21 |
| 發(fā)明(設計)人: | 鄧練兵;楊興;吳浩清 | 申請(專利權)人: | 珠海大橫琴科技發(fā)展有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 梁巖 |
| 地址: | 519000 廣東省珠海市橫琴新*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 模型 訓練 方法 裝置 | ||
本發(fā)明公開了一種字符識別模型的訓練方法及裝置、字符識別方法及裝置,該字符識別模型的訓練方法包括:獲取訓練樣本,所述訓練樣本中包含具有字符的正樣本圖像及不具有字符的負樣本圖像;對所述訓練樣本進行分割,得到目標訓練字符;根據所述目標訓練字符提取第一目標訓練特征;根據所述第一目標訓練特征對深度可分離卷積神經網絡模型進行訓練,得到深度可分離卷積字符識別模型。本發(fā)明通過采用深度可分離卷積神經網絡模型,可以實現空間信息和深度信息解耦合,減少網絡參數量,提高訓練準確率。
技術領域
本發(fā)明涉及識別技術領域,具體涉及一種字符識別模型的訓練方法及裝置、字符識別方法及裝置。
背景技術
隨著計算機的發(fā)展,信息技術也飛速發(fā)展,圖像作為信息技術中的重要傳播載體,在信息的傳播中占有非常重要的地位,然而計算機并不能像人類一樣通過視覺直接獲取圖像中所包含的信息,從而圖像信息識別為文本信息這一過程對于計算機理解圖像具有重要的意義。
傳統(tǒng)的字符識別算法包含了大量的手工特征提取的過程,提取過程復雜且緩慢,而基于卷積神經網絡的特征提取可以直接對圖像進行處理,自動提取特征,但是提取過程網絡參數量巨大,訓練過程復雜,訓練速度慢,訓練準確率低。
發(fā)明內容
因此,本發(fā)明要解決的技術問題在于克服現有技術中的基于卷積神經網絡對特征提取時網絡參數量大的缺陷,從而提供一種字符識別模型的訓練方法及裝置、字符識別方法及裝置。
根據第一方面,本發(fā)明實施例公開了一種字符識別模型的訓練方法,包括如下步驟:獲取訓練樣本,所述訓練樣本中包含具有字符的正樣本圖像及不具有字符的負樣本圖像;對所述訓練樣本進行分割,得到目標訓練字符;根據所述目標訓練字符提取第一目標訓練特征;根據所述第一目標訓練特征對深度可分離卷積神經網絡模型進行訓練,得到深度可分離卷積字符識別模型。
結合第一方面,在第一方面第一實施方式中,在所述對所述訓練樣本進行分割,得到目標訓練字符之前,還包括:確定所述訓練樣本中字符傾斜度;當所述字符傾斜度不滿足第一預設條件時,對所述訓練樣本進行傾斜矯正。
結合第一方面第一實施方式,在第一方面第二實施方式中,在根據所述第一目標訓練特征對深度可分離卷積神經網絡模型進行訓練,得到深度可分離卷積字符識別模型之后,還包括:獲取字符圖像測試樣本,所述字符圖像測試樣本中包含具有字符的正樣本圖像及不具有字符的負樣本圖像;根據所述字符圖像測試樣本提取第一測試特征;根據所述第一測試特征對所述深度可分離卷積字符識別模型進行測試,得到第一測試結果;當所述第一測試結果滿足第二預設條件時,將所述深度可分離卷積字符識別模型確定為可用的深度可分離卷積字符識別模型。
根據第二方面,本發(fā)明實施例還公開了一種字符識別方法,包括如下步驟:獲取待識別字符圖像;對所述待識別字符圖像進行分割,得到目標識別字符;根據所述目標識別字符提取目標識別特征;根據深度可分離卷積字符識別模型對所述目標識別特征進行識別,得到字符識別結果;所述深度可分離卷積字符識別模型為根據第一方面或第一方面任一實施方式所述的字符識別模型的訓練方法訓練得到;將所述字符識別結果進行組合,得到待識別字符。
根據第三方面,本發(fā)明實施例還公開了一種字符識別模型的訓練裝置,包括:第一獲取模塊,用于獲取訓練樣本,所述訓練樣本中包含具有字符的正樣本圖像及不具有字符的負樣本圖像;第一分割模塊,用于對所述訓練樣本進行分割,得到目標訓練字符;第一提取模塊,用于根據所述目標訓練字符提取第一目標訓練特征;訓練模塊,用于根據所述第一目標訓練特征對深度可分離卷積神經網絡模型進行訓練,得到深度可分離卷積字符識別模型。
結合第三方面,在第三方面第一實施方式中,所述裝置還包括:第一確定模塊,用于確定所述訓練樣本中字符傾斜度;矯正模塊,用于當所述字符傾斜度不滿足第一預設條件時,對所述訓練樣本進行傾斜矯正。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海大橫琴科技發(fā)展有限公司,未經珠海大橫琴科技發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911347934.1/2.html,轉載請聲明來源鉆瓜專利網。





