[發明專利]分割字符的方法及裝置有效
| 申請號: | 201410515466.5 | 申請日: | 2014-09-29 |
| 公開(公告)號: | CN104239879B | 公開(公告)日: | 2017-11-07 |
| 發明(設計)人: | 徐曉舟;陳志軍;王琳 | 申請(專利權)人: | 小米科技有限責任公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京尚倫律師事務所11477 | 代理人: | 代治國 |
| 地址: | 100085 北京市海淀區清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分割 字符 方法 裝置 | ||
技術領域
本公開涉及圖像處理技術領域,尤其涉及分割字符的方法及裝置。
背景技術
相關技術中,OCR(Optical Character Recognition,光學字符識別)的字符檢測與分割技術主要基于連通域分析和直方圖。相關技術中的分割字符方法包括:對圖像進行預處理,例如進行二值化、平滑、去噪等;然后進行連通域分析,根據連通域分析結果去除背景;再獲得圖像的直方圖,根據直方圖分割字符。
圖像中可能存在干擾的連通域,例如充值卡的卡片中存在涂層、背景中有條形碼,條形碼和未被完全刮除的涂層可能會被判定為連通域。相關技術中,僅通過連通域分析去除背景,并利用直方圖分割字符,圖像中去除背景后的區域中仍然可能包含干擾的連通域,如此造成分割字符困難,并降低了分割字符的準確性。
發明內容
為克服相關技術中存在的問題,本公開實施例提供分割字符的方法及裝置,用于提高分割字符的準確性。
根據本公開實施例的第一方面,提供一種分割字符的方法,包括:
利用字符識別算法從圖像中檢測出單個字符區域,根據檢測出的單個字符區域確定待分割字符所在區域的上下邊界,去除所述圖像中所述上下邊界之外的區域,得到目標區域;
利用邊界識別算法檢測所述目標區域中連通域邊界,根據所述邊界確定各個連通域在多個位置處的筆畫寬度;
根據連通域在多個位置處的筆畫寬度間偏差判斷所述連通域是否為噪音區域,將判定為噪音區域的連通域從目標區域中去除;
將所述目標區域的前景像素進行水平投影,獲得水平投影直方圖,利用水平投影直方圖確定分割字符的分割點,從分割點處進行分割。
在一實施例中,所述利用字符識別算法從圖像中檢測出單個字符區域之前,所述方法還可包括:
對所述圖像進行預處理。
在一實施例中,所述根據檢測出的單個字符區域確定待分割字符所在區域的上下邊界,可包括:
對于各個單個字符區域,確定所述單個字符區域的上邊界和下邊界;
對所述上邊界和所述下邊界分別進行樣本采樣,并分別計算采樣的樣本間偏差;
當采樣的樣本間偏差沒有在第一預設偏差范圍內時,重新進行樣本采樣,直到采樣的樣本間偏差在第一預設偏差范圍內為止;
當上邊界或下邊界的樣本間偏差在第一預設偏差范圍內時,確定待分割字符所在區域的上邊界或下邊界的值為采樣的樣本的平均值。
在一實施例中,所述根據所述邊界確定各個連通域在多個位置的筆畫寬度,可包括:
對于各個連通域,在所述連通域邊界的一條邊上取多個邊界點;
對于每個邊界點,在所述邊界點的梯度方向上查找到位于所述連通域邊界的另一條邊上的另一邊界點,確定所述邊界點與所述另一邊界點間距離為所述連通域在所述邊界點處的筆畫寬度。
在一實施例中,所述根據連通域在多個位置的筆畫寬度間偏差判斷所述連通域是否為噪音區域,可包括:
計算連通域在多個位置處的筆畫寬度的均值和方差;
當所述方差與所述均值的比值大于第一預設閾值時,判定所述連通域為噪音區域。
在一實施例中,所述利用水平投影直方圖確定分割字符的分割點,可包括:
將水平投影直方圖在水平軸上的投影像素值小于第二預設閾值的位置,確定為分割點;
將位于水平軸上連續空白區域中的分割點合并。
在一實施例中,所述方法還可包括:
根據目標區域中連通域的邊界確定所述連通域的區域寬度和區域高度,選取區域寬高比在預設范圍內的連通域,根據選取的連通域的區域寬度確定字符參考寬度;
所述從分割點處進行分割之后,還包括:
根據所述字符參考寬度判斷分割后所得的各個字符區域中是否包含多個字符;
當分割后所得字符區域中包含多個字符時,根據所述字符區域的水平投影直方圖和字符參考寬度,分割所述字符區域。
在一實施例中,所述根據所述字符區域的水平投影直方圖和字符參考寬度,分割所述字符區域,可包括:
選取所述字符區域中多處位置作為單側邊界點,對于各個單側邊界點,根據所述字符參考寬度進行分割,獲得多個分割方式;
對于各個分割方式,計算分割區域的內部與邊界處的、水平投影直方圖在水平軸上的投影像素值的比值;
按所述比值最大的分割方式,對所述字符區域進行分割。
在一實施例中,所述將所述目標區域的前景像素進行水平投影,獲得水平投影直方圖之后,還可包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于小米科技有限責任公司,未經小米科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410515466.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種盲人專用杯
- 下一篇:一種基于曲線弧分割的橢圓檢測方法





