[發明專利]一種基于Gabor的計算機圖像驗證碼識別算法在審
| 申請號: | 201610810107.1 | 申請日: | 2016-09-08 |
| 公開(公告)號: | CN107808155A | 公開(公告)日: | 2018-03-16 |
| 發明(設計)人: | 吳賢城 | 申請(專利權)人: | 吳賢城 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 51800*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 gabor 計算機 圖像 驗證 識別 算法 | ||
技術領域
本發明涉及計算機圖像驗證碼識別領域,尤其設計一種通過Gabor濾波實現圖像自動識別的技術及其方法。本發明包含兩部分,第一部分為提取用于識別計算機圖像驗證碼內容的特征集過程,第二部分為基于機器學習方法的計算機圖像驗證碼識別模型的訓練與識別過程。計算機圖像驗證碼內容特征集的提取采用與人類視覺系統相似的二維離散Gabor濾波與計算機圖像驗證碼做卷積后得到,采用不同的參數以得到不同的圖像特征集,包括波長、相位、方向、高斯標準差和窗口比率等;基于機器學習的方法采用有監督學習的支持向量機方法實現,采用高斯徑向基RBF核函數,根據已標識計算機圖像驗證碼進行訓練得到識別模型后,根據模型對未知計算機圖像驗證碼內容進行識別。
背景技術
CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)技術是一種廣泛使用的用于區分人與機器的技術,該技術常見的形式是通過圖像驗證碼來阻止非人類的訪問。這類圖像驗證碼一般采用增加扭曲、增加背景色、字符旋轉和加入椒鹽噪聲等手段使得普通的圖像識別算法無法正確識別圖像內容。
發明內容
為了克服普通圖像識別算法無法識別圖像驗證碼的問題,本發明通過基于Gabor濾波的方法解決這一問題。Gabor變換在信號的時頻分析中有著廣泛的應用,而離散Gabor變換在圖像處理中由于符合人類視覺系統的多分辨率多通信的特性也有較多的研究,研究發現二維的Gabor函數與人類腦部負責視覺系統的皮層接受野相似,因此可以通過Gabor濾波來有效地模仿人類視覺系統表示圖像,進而可以應用在圖像的紋理提取和圖像識別等方面。二維的Gabor函數是由正統函數和高斯函數調制而成的,其表達式可以用公式表示如附圖1。
圖1公式為Gabor函數的復數形式,一般情況下我們只考慮其實值部分,如圖2所示。
實值部分對應于頻率于的幅值部分,其中參數λ表示波長,θ表示方向,φ對應于相移,σ為高斯函數的標準差, 對應于窗口的寬高比率。
將不同參數的Gabor濾波作用于驗證碼圖像,獲得圖像的特征集,作為SVM的輸入。
圖像的識別可以劃分為訓練和分類兩個過程。首先輸入一批帶標簽的驗證碼,在對驗證碼圖像進行預處理和Gabor變換后提取得到相應的圖像特征,再將得到的特征集輸入SVM訓練器進行訓練,將訓練后得結果保存為識別模型。對未知的驗證碼進行識別時需要先載入訓練好的模型,對圖像進行同樣的預處理操作和Gabor變換后將得到的圖像特征輸入SVM模型從而得到分類的結果即識別碼。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖3為基于Gabor的OCR算法處理流程;
圖4為本發明實施過程中得到的部分特征圖像;
圖5為本發明實施的具體案例圖像;
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
實施例1:
如圖5所示,我們將首先獲取足夠量的圖像驗證碼,通過人工標注的方法將圖像驗證碼的內容進行標識并將整幅圖像按字符切割成單個字符,保證每個字符都有足夠量的對應圖像驗證碼樣本。將切割得到的圖像通過二維離散Gabor濾波得到特征集Fλ,θ,φ,σ,γ,如圖6所示。
其中*表示卷積乘。
不同的Gabor濾波參數代表不同的濾波效果,如λ參數表示二維Gabor的波長,用于模擬人眼對于圖像識別的層次感。波長大,得到的將是圖像的輪廓特征,波長小時,通過卷積得到的將是圖像的細節特征。將不同Gabor參數得到特征集作為支持向量機的特征集輸入,如圖7所示。
Fi對應于第i組參數得到的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吳賢城,未經吳賢城許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610810107.1/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





