[發明專利]一種字符識別方法和裝置有效
| 申請號: | 201610188113.8 | 申請日: | 2016-03-29 |
| 公開(公告)號: | CN107239786B | 公開(公告)日: | 2022-01-11 |
| 發明(設計)人: | 毛旭東;施興;褚崴;程孟力;周文猛 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 識別 方法 裝置 | ||
本申請提供了一種字符識別方法和裝置,涉及圖像識別技術領域。所述方法包括:獲取圖片數據;利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器;將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;將所述第一結果帶入第二分類器中除共享的計算層之外剩余的計算層進行計算,得到第二概率;根據所述第一概率和第二概率,計算所述圖片數據識別為各個字符的置信度;根據置信度,輸出字符的識別結果。從而降低了計算時間,提高了字符識別的效率。
技術領域
本申請涉及圖像識別技術領域,特別是涉及一種字符識別方法和一種字符識別裝置。
背景技術
近年來隨著計算機技術和數字圖像處理技術的飛速發展,圖片識別技術尤其是對于圖片中的數字、字母、特殊符號等字符進行識別的技術越來越多的在各個方面都有著較為廣泛的應用需求。
對于識別圖片中的字符,目前存在的識別過程是:
1、檢測到圖片中字符的位置;
2、切分成包含單個字符的圖片數據;
3、使用字符分類器識別各個圖片數據。
其中,對于字符分類器,目前實現的方案主要包括以下兩種:1)首先提取圖片的特征,比如HOG(Histogram of Oriented Gradient,方向梯度直方圖)特征,然后使用SVM(Support Vector Machine,支持向量機)分類器、神經網絡分類器等訓練字符識別模型;2)利用卷積神經網絡(Convolutional Neural Networks,CNN),訓練字符識別模型。然后利用訓練好的字符識別模型對輸入的圖片數據進行字符識別。
但是在實際應用過程中,例如在圖片比較模糊或者圖片中包含的字符比較多的情況下,可能會導致檢測到的字符位置不夠準確,其中會存在一些噪聲,例如不是字符的斑點等被檢測為字符,進而造成切分成的圖片數據中存在一些包含噪聲的圖片數據,所以在利用分類器識別各個圖片數據之后,需要從中篩選出不是噪聲的輸出結果。以身份證識別為例,如圖1A,其是從一張身份證圖片的身份證號碼區域切分得到的單字圖。如圖1A,在圖片本身比較模糊的時候,定位號碼行會不是很準確,頭部或者尾部會多出來一些噪聲,造成切單字的時候,會切出來前邊的噪聲,導致切出來的單字大于18個,需要選取18個數字。
針對上述的問題,已有的技術方案是增加一個識別“是不是字符”的CNN分類器。利用這個分類器,先排除不是數字的圖片數據,然后再利用“是何種字符”的字符分類器識別剩下的圖片數據,從剩下的圖片數據中識別具體的字符。但是該技術方案存在一定的缺點,如下:
首先,增加一個分類器,其是先后進行計算,意味著同時增加了計算時間,影響運行效率;
其次,在實際操作中,如果增加的用以識別“是不是數字”的CNN分類器的計算結果出現錯誤,則不管后續的字符識別模型是否會出現問題,整個識別過程都會不可避免地發生錯誤,降低了字符識別的準確性。
發明內容
鑒于上述問題,提出了本申請實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種字符識別方法和相應的一種字符識別裝置。
為了解決上述問題,本申請公開了一種字符識別方法,其特征在于,包括:
獲取圖片數據;
利用第一分類器和第二分類器共享的計算層對所述圖片數據進行計算,得到第一結果;所述第一分類器為從圖片數據中識別具體字符的分類器;所述第二分類器為識別圖片數據是否為字符圖片的分類器;
將所述第一結果帶入第一分類器中除共享的計算層之外剩余的計算層進行計算,得到對應各字符的第一概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610188113.8/2.html,轉載請聲明來源鉆瓜專利網。





