[發明專利]一種筆畫寬度提取方法、裝置及一種文字識別方法、系統有效
| 申請號: | 201210169811.5 | 申請日: | 2012-05-28 |
| 公開(公告)號: | CN103455816B | 公開(公告)日: | 2017-04-19 |
| 發明(設計)人: | 鄭琪;王永攀 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/20 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 筆畫 寬度 提取 方法 裝置 文字 識別 系統 | ||
1.一種筆畫寬度提取方法,其特征在于,包括:
提取筆畫的原始連通分量并對應一候選筆畫寬度;
對所述原始連通分量進行腐蝕計算,并計算每次腐蝕前的連通分量的輪廓周長,組成周長直方圖;
每次腐蝕計算后得到的連通分量對應一候選筆畫寬度,對所述周長直方圖進行差分計算,得到各候選筆畫寬度對應的筆畫長度;
將各候選筆畫寬度對應的筆畫長度組成筆畫寬度直方圖;
依據所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區域,如果是文字區域,則依據極大值確定該文字區域的筆畫寬度。
2.根據權利要求1所述的方法,其特征在于,所述對所述周長直方圖進行差分計算,得到各候選筆畫寬度對應的筆畫長度,包括:
將所述周長直方圖中第n次腐蝕前的連通分量的輪廓周長減去第n+1次腐蝕前的連通分量的輪廓周長,得到第n個候選筆畫寬度對應的筆畫長度;其中,n為正整數。
3.根據權利要求1或2所述的方法,其特征在于,所述依據所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區域,包括:
尋找筆畫寬度直方圖中縱坐標表示的筆畫長度的極大值,所述筆畫寬度直方圖中的橫坐標表示筆畫寬度,所述極大值對應的筆畫寬度為峰值寬度;
從所述極大值中選出最大值和次大值;
如果所述最大值和次大值之和占筆畫寬度直方圖中筆畫長度總長度的比例小于第一閾值,或者,最大峰值寬度與最大寬度之差超過第二閾值,則所述原始連通分量為非文字區域;否則,為文字區域。
4.根據權利要求3所述的方法,其特征在于:
如果極大值為一個,或者次大值小于最大值的x%,則舍棄次大值;其中,x為預設值。
5.根據權利要求3所述的方法,其特征在于,所述依據極大值確定該文字區域的筆畫寬度,包括:
確定筆畫寬度直方圖中極大值對應的峰值寬度為m,m為正整數;
計算2m或2m-1并作為該文字區域的筆畫寬度;
其中,如果極大值為一個,則該文字區域得到一個筆畫寬度;如果極大值有兩個,則該文字區域得到兩個筆畫寬度。
6.根據權利要求1所述的方法,其特征在于,所述依據所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區域之前,還包括:
對所述筆畫寬度直方圖按照以下公式進行平滑操作:
l'n=w1ln-1+w0ln+w1ln+1;
其中,l'n表示平滑后的筆畫長度,ln-1、ln、ln+1均表示平滑前的筆畫長度,w0和w1表示平滑權值,n表示第n次腐蝕,n-1表示第n-1次腐蝕,n+1表示第n+1次腐蝕。
7.根據權利要求1所述的方法,其特征在于,所述對所述原始連通分量進行腐蝕計算,并計算每次腐蝕前的連通分量的輪廓周長,包括:
選取原始連通分量的輪廓上的點作為初始點集;
從初始點集開始,對原始連通分量中的每個點進行廣度遍歷,獲得每個點距離所述初始點集的最短路徑長度,并將所述最短路徑長度作為該點的腐蝕次數;
統計具有相同腐蝕次數n的點的個數,作為第n次腐蝕前的連通分量的輪廓周長,n為正整數。
8.根據權利要求7所述的方法,其特征在于:
對原始連通分量中的每個點進行4鄰接的廣度遍歷。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210169811.5/1.html,轉載請聲明來源鉆瓜專利網。





