[發明專利]光學字符識別方法及裝置有效
| 申請號: | 201410299362.5 | 申請日: | 2014-06-26 |
| 公開(公告)號: | CN104112130B | 公開(公告)日: | 2017-08-01 |
| 發明(設計)人: | 陳志軍;張祺深;臧虎 | 申請(專利權)人: | 小米科技有限責任公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/54;G06T5/00 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司11138 | 代理人: | 劉映東 |
| 地址: | 100085 北京市海淀區清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 光學 字符 識別 方法 裝置 | ||
1.一種光學字符識別方法,其特征在于,包括:
從原始圖像中提取字符塊;
基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫;
設所述斷裂的筆畫中的斷裂區域沿其所在筆畫的方向與其所在筆畫的交界像素點分別為第一交界點和第二交界點,將所述第一交界點和所述第二交界點之間沿所述第一交界點的筆畫方向、寬度等于所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值的平均值的區域設置為準筆畫區域,其中,所述第一交界點的筆畫寬度值和所述第二交界點的筆畫寬度值通過筆畫寬度變換算法獲得;
將所述準筆畫區域的灰度值設置為與所述字符塊中筆畫區域的灰度值一致的值以得到準識別圖像;
對所述準識別圖像進行字符識別,得到所述準識別圖像中的文本信息。
2.根據權利要求1所述的光學字符識別方法,其特征在于,所述基于筆畫寬度變換,確定所述字符塊中斷裂的筆畫包括:
設置斷裂長度閾值;
確定所述字符塊的筆畫區域像素點所在筆畫的方向;
判斷在所述筆畫區域像素點所在筆畫的方向上,所述筆畫區域像素點與其下一個筆畫區域像素點之間是否存在筆畫寬度突變區域,且所述筆畫寬度突變區域的長度小于所述斷裂長度閾值,所述筆畫寬度突變區域為空白區域、筆畫寬度增大值大于設定第一寬度變化閾值或筆畫寬度減小值大于設定第二寬度變化閾值的區域;
當存在所述筆畫寬度突變區域時,確定所述筆畫區域像素點所在筆畫為斷裂的筆畫,確定所述筆畫寬度突變區域為所述斷裂的筆畫中的斷裂區域。
3.根據權利要求1所述的光學字符識別方法,其特征在于,所述對所述斷裂的筆畫補齊還包括:
當所述斷裂區域為所述斷裂的筆畫中的筆畫寬度顯著增大區域時,將所述斷裂區域中處于所述準筆畫區域之外的筆畫區域的灰度值設置為與所述字符塊中背景區域的灰度值一致的值。
4.根據權利要求1所述的光學字符識別方法,其特征在于,在所述對所述準識別圖像進行字符識別之前,還包括:
基于筆畫寬度變換,檢測所述字符塊中的噪聲;
消除所述噪聲。
5.根據權利要求4所述的光學字符識別方法,其特征在于,所述基于筆畫寬度變換,檢測所述字符塊中的噪聲包括:
確定所述字符塊的筆畫寬度W,字符塊i的筆畫寬度等于第一寬度平均值與第二寬度平均值之和的二分之一,所述第一寬度平均值為字符塊i的平均筆畫寬度值,字符塊i的平均筆畫寬度值等于字符塊i中所有筆畫區域像素點的筆畫寬度值的平均值,所述第二寬度平均值為從所述原始圖像中提取出的所有字符塊的平均筆畫寬度值的平均值,i為自然數,筆畫區域像素點的筆畫寬度值通過筆畫寬度變換算法獲得;
設置字符筆畫寬度誤差d;
判斷所述字符塊中筆畫寬度處于區間[W-d,W+d]之外的筆畫區域是否滿足如下成噪條件之一:所述筆畫區域的設定范圍內沒有與所述筆畫方向相符合的筆畫、沿所述筆畫區域的筆畫寬度變化波動值大于設定波動閾值或者所述筆畫區域的筆畫長度小于設定長度閾值;
當所述字符塊中筆畫寬度處于區間[W-d,W+d]之外的筆畫區域滿足所述成噪條件之一時,判定所述字符塊中筆畫寬度處于區間[W-d,W+d]之外的筆畫區域為噪聲。
6.根據權利要求4所述的光學字符識別方法,其特征在于,所述消除所述噪聲包括:
將所述噪聲的灰度值設置為與所述字符塊中背景區域的灰度值一致的值。
7.根據權利要求1或5所述的光學字符識別方法,其特征在于,所述筆畫寬度變換算法包括:
對所述字符塊進行邊緣檢測,找到邊緣像素點,所述邊緣像素點具有一個方向梯度值;
按照任一邊緣像素點p的梯度方向dp沿路線r查找與邊緣像素點p相匹配的邊緣像素點q,邊緣像素點q的梯度方向dq與邊緣像素點p的梯度方向dp相反,其中,r=p+n*dp,n大于或等于0;
當查找到所述邊緣像素點q時,指定所述邊緣像素點p與所述邊緣像素點q的連線上每個像素點的筆畫寬度值為所述邊緣像素點p與所述邊緣像素點q之間的歐式距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于小米科技有限責任公司,未經小米科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410299362.5/1.html,轉載請聲明來源鉆瓜專利網。





