[發明專利]字符識別方法和字符識別裝置有效
| 申請號: | 201310060434.6 | 申請日: | 2013-02-26 |
| 公開(公告)號: | CN104008384B | 公開(公告)日: | 2017-11-14 |
| 發明(設計)人: | 邢月啟;許春凱;董述恂;王春濤 | 申請(專利權)人: | 山東新北洋信息技術股份有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 吳貴明,李志剛 |
| 地址: | 264203 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 方法 裝置 | ||
技術領域
本發明涉及字符識別領域,具體而言,涉及一種字符識別方法和字符識別裝置。
背景技術
傳統的字符識別方法包括:a)掃描獲取原稿的灰度圖像;b)通過對獲取到的圖像的灰度直方圖的分析和計算來得到閾值,根據閾值對灰度圖像進行二值化處理得到二值圖像;c)對二值圖像進行字符切割,對切割的字符塊和模板字符進行對比,選取與模板字符最相近的字符為識別字符。
在傳統的字符識別方法中,進行閾值計算的方法有Otsu方法、NiBlack方法、最小誤差法或最大熵方法等。發明人發現,無論采用哪種方法獲得的閾值,在對灰度圖像進行二值化處理時均存在一定的局限性。具體的,對于對比度低的原稿,使用單一閾值對原稿圖像二值化時容易產生失真現象。比如,當需要進行字符識別的原稿為紙幣時,由于紙幣在使用過程中容易受到磨損、污染或涂鴉,因此,紙幣圖像的對比度較低,如圖1a所示的紙幣號碼區域圖像,由于字符“C”所在區域受到污染,當利用傳統的字符識別方法使用單一閾值對圖1a所示圖像進行二值化處理得到圖1b所示的二值圖像,從圖中可以看出,很難準確識別出字符“C”。因此,傳統的字符識別方法僅適用于識別圖像對比度高的原稿,而對圖像對比度低的原稿識別率較低。
發明內容
本發明的主要目的在于提供一種字符識別方法和字符識別裝置,以解決傳統的字符識別方法僅適用于識別圖像對比度高的原稿,而對圖像對比度低的原稿識別率較低的問題。
為了實現上述目的,根據本發明的一個方面,提供了一種字符識別方法。該字符識別方法包括:獲取閾值數組,其中,閾值數組包括多個閾值;從閾值數組中選取第一閾值作為選定閾值;步驟a,采用選定閾值對字符圖像進行二值化處理,得到字符圖像的二值圖像;步驟b,對二值圖像進行字符識別,得到識別結果;步驟c,計算識別結果的置信度;步驟d,判斷識別結果的置信度是否大于置信度預定值,如果識別結果的置信度大于置信度預定值,則將識別結果作為字符圖像的識別結果;以及如果識別結果的置信度不大于置信度預定值,則從閾值數組中選取第二閾值,采用第二閾值替換第一閾值作為選定閾值,并返回執行步驟a。
進一步地,步驟a還包括:切分二值圖像,得到N個切分區域,其中,N個切分區域中的每一個切分區域分別與一個待識別字符相對應。步驟b包括:對N個切分區域進行字符識別,得到分別對應于N個切分區域的N個識別結果。步驟c包括:計算N個識別結果的置信度。步驟d包括:判斷N個識別結果的置信度是否均大于置信度預定值,如果N個識別結果的置信度均大于置信度預定值,則確定識別結果的置信度大于置信度預定值,如果N個識別結果中任意一個的置信度不大于置信度預定值,則確定識別結果的置信度不大于置信度預定值。
進一步地,在選取第一閾值作為選定閾值時,如果N個識別結果中任意一個的置信度不大于置信度預定值,該方法還包括:記錄第一切分區域的識別結果和第二切分區域,其中,第一切分區域為N個識別結果中置信度大于置信度預定值的識別結果對應的切分區域,第二切分區域為N個識別結果中置信度不大于置信度預定值的識別結果對應的切分區域。在選取第二閾值作為選定閾值時:步驟a包括:采用第二閾值作為選定閾值對字符圖像進行二值化處理,得到字符圖像的二值圖像,切分二值圖像,得到N個切分區域,步驟b包括:對N個切分區域中與第二切分區域對應的切分區域進行字符識別。
進一步地,在采用選定閾值對字符圖像進行二值化處理之前,該方法還包括:獲取字符圖像的直方圖;對字符圖像的直方圖進行計算,得到基礎閾值;以基礎閾值為中心閾值進行拓展得到閾值數組。
進一步地,采用以下方式由基礎閾值為中心閾值進行拓展得到閾值數組TH:
TH={T0,T0+Δ,T0-Δ,T0+2Δ,T0-2Δ,…},
其中,Δ為閾值數組TH中相鄰閾值之間的差值,T0為基礎閾值。
為了實現上述目的,根據本發明的另一方面,提供了一種字符識別裝置。該字符識別裝置包括:獲取單元,用于獲取閾值數組,其中,閾值數組包括多個閾值;二值化處理單元,用于采用選定閾值對字符圖像進行二值化處理,得到字符圖像的二值圖像;識別單元,用于對二值圖像進行字符識別,得到識別結果;計算單元,用于計算識別結果的置信度;判斷單元,判斷識別結果的置信度是否大于置信度預定值,其中,如果識別結果的置信度大于置信度預定值,則將識別結果作為字符圖像的識別結果;選取單元,用于從閾值數組中選取第一閾值或第二閾值作為選定閾值,其中,首先選取第一閾值作為選定閾值,在第一閾值作為選定閾值時,如果識別結果的置信度不大于置信度預定值,則從閾值數組中選取第二閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東新北洋信息技術股份有限公司,未經山東新北洋信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310060434.6/2.html,轉載請聲明來源鉆瓜專利網。





