[發明專利]一種針對中文字符驗證碼的二值化和分割方法有效
| 申請號: | 201710076581.0 | 申請日: | 2017-02-13 |
| 公開(公告)號: | CN107038445B | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 武星;裴孟齊 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/54;G06K9/62 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 中文 字符 驗證 二值化 分割 方法 | ||
本發明涉及一種針對中文字符驗證碼的二值化和分割方法,目的在于對中文字符圖像進行有效的前背景分割。本方法主要利用了高斯平滑濾波、形態學重建與Mean Shift聚類方法,首先,對圖像進行灰度化以及除噪。對獲取到的驗證碼圖像進行灰度化,并針對圖像噪聲情況應用不同去噪方法,得到適合識別文字的字符圖像。其次,對圖像進行二值化,將前景的字符和背景分割開,進而定位表示字符的像素點。再次,對字符點進行聚類。對原始圖像中的字符像素點應用Mean Shift聚類方法,得到這些字符的聚類。經過聚類調整后,處于同一聚類點的字符像素點將看作是表示同一字符。由此得到驗證碼圖像中的每一個字符的像素點表示,即字符分割完畢。
技術領域
本發明涉及一種過濾二維字符驗證碼中背景噪聲的方法,更具體地說,是一種針對中文字符驗證碼的二值化和分割方法。
背景技術
字符驗證碼被廣泛應用于互聯網服務中,作為判斷網絡請求是否來自合法用戶的工具,從而防范機器的大量自動請求,保障網站服務器的穩定運行。字符驗證碼是目前最常被使用的一類驗證碼。該類驗證碼通常需要用戶完成一個文字識別任務,用戶需要正確識別出由計算機圖像技術生成的字符圖像中的各個字符以通過驗證。為了提高機器識別驗證碼的難度,該類驗證碼的圖像中通常會伴隨有噪點、干擾線等作為干擾,字符本身通常會經過旋轉、對稱、仿射等變換。此外,一些驗證碼開始采用中文字符作為待識別字符。由于中文字符的筆劃較多,線條結構較為復雜,使得傳統方法難以有效地將字符前景與干擾背景分割開來。
字符類驗證碼識別的一般流程為:獲取圖像,圖像預處理,字符分割,字符特征提取,字符識別。其中,驗證碼圖像的預處理主要是對圖像進行前背景分割:噪點、干擾線等被分為背景,進而將其過濾掉;字符被分為前景,以備特征提取和識別。
現有的字符類驗證碼識別中,預處理時通常借助大津法得到全局二值化閾值。這種方法不適用于存在背景漸變的驗證碼。此外,現有的識別方法對字符的分割主要采用豎直投影方法、基于連通區域分析的方法等。基于豎直投影的方法基于驗證碼中字符呈水平分布這一假設對圖像進行字符分割。如果驗證碼中字符之間存在較密集的粘連,或是字符的分布不是水平時,這種方法很難從統計出的垂直投影直方圖中估計出字符間隙,最終無法有效分割字符。基于連通區域分析的方法利用驗證碼中同一字符筆畫的連通性,對圖像進行字符分割。這種方法不適合分割中文字符驗證碼,漢字字符中,一個字符可能包含多個連通域。
發明內容
本發明的目的在于提供一種針對中文字符驗證碼的二值化和分割方法,利用高斯平滑濾波、形態學重建與Mean Shift聚類方法,能夠對中文字符圖像進行有效的前背景分割。
為實現上述目的,本發明采用如下技術方案:
一種針對中文字符驗證碼的二值化和分割方法,具體操作步驟如下:
(1)對獲取到的原始驗證碼圖像灰度化;
(2)對灰度圖像進行去噪和二值化;去噪時,針對不同圖像噪聲情況應用不同去噪方法;
(3)定位前景字符點;統計前景、背景像素點數量,取數量較多的一類為背景點,數量較少的一類為前景點;
(4)對字符點進行聚類;針對待識別驗證碼圖像的特點,選擇不同的數據維度利用Mean Shift方法進行聚類;
(5)聚類調整:聚類后,對于分布比較分散的聚類,進一步對其進行聚類,得到更小更緊密的聚類;經過聚類調整后,處于同一個聚類點的字符像素點將看作是表示同一個字符,由此得到驗證碼圖像中的每一個字符的像素點表示,即字符分割完畢。
所述步驟(2)中的針對不同圖像噪聲情況應用不同去噪方法,具體為:如果干擾線較粗或較密,或是驗證碼背景存在漸變,則運用核大小為1.0的高斯平滑和形態學重建方法;如果圖像中字符與背景顏色對比度不強,則運用核大小為0.3的高斯平滑和形態學重建方法;如果干擾線較少,且背景無漸變,字符和背景對比度較高,則不進行去噪。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710076581.0/2.html,轉載請聲明來源鉆瓜專利網。





