[發明專利]一種倒置漢字驗證碼自動識別方法及系統有效
| 申請號: | 201710599718.0 | 申請日: | 2017-07-21 |
| 公開(公告)號: | CN107292307B | 公開(公告)日: | 2019-12-17 |
| 發明(設計)人: | 路松峰;羅立志;王同洋 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/36;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 42201 華中科技大學專利中心 | 代理人: | 廖盈春;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 倒置 漢字 驗證 自動識別 方法 系統 | ||
本發明公開了一種倒置漢字驗證碼自動識別方法及系統,所述方法包括:對待識別驗證碼圖像進行處理得到目標驗證碼圖像,由目標驗證碼圖像中每個字符的左右邊界對所述目標驗證碼圖像進行分割得到各單字符圖像;生成與目標驗證碼圖像對應的標簽信息,標簽信息采用二進制表示,0表示單字符圖像中的字符正常,1表示單字符圖像中的字符倒置;將標簽信息的長度作為參數傳遞給已訓練的倒置漢字自動識別模型,由倒置漢字自動識別模型將神經元的output個數設置為與標簽信息的長度一致;使用交叉熵之和作為已訓練的倒置漢字自動識別模型的損失函數,對損失函數進行訓練,直至損失函數收斂,輸出識別結果。可實現對倒置漢字驗證碼的自動識別。
技術領域
本發明屬于自動識別技術領域,更具體地,涉及一種倒置漢字驗證碼自動識別方法及系統。
背景技術
隨著互聯網的高速發展,網絡在給人們的生活帶來極大便利的同時,其安全問題也日益突出。網絡驗證碼作為一項廣泛使用的驗證手段,對網絡安全起到了重要的作用。
目前,對于字符型驗證碼的識別主要就是對于文字的識別,主要流程如下:準備原始圖片素材;圖片預處理,字符切割,圖片尺寸歸一化;圖片字符標記;字符圖片特征提取;生成特征和標記對應的訓練數據集;訓練特征標記數據生成識別模型;使用識別模型預測新的未知圖片集。
然而,傳統的驗證碼識別技術是對驗證碼中出現的字符進行識別,比如數字,字母等。而沒有關于如何對倒置中文字符的識別。
發明內容
針對現有技術的以上缺陷或改進需求,本發明的目的在于提供了一種倒置漢字驗證碼自動識別方法及系統,由此解決傳統的驗證碼識別技術不能識別倒置中文字符的技術問題。
為實現上述目的,按照本發明的一個方面,提供了一種倒置漢字驗證碼自動識別方法,包括:
對待識別驗證碼圖像進行處理得到目標驗證碼圖像,獲取所述目標驗證碼圖像中每個字符的左右邊界,根據所述每個字符的左右邊界對所述目標驗證碼圖像進行分割得到各單字符圖像;
生成與所述目標驗證碼圖像對應的標簽信息,其中,所述標簽信息采用二進制表示,0表示單字符圖像中的字符正常,1表示單字符圖像中的字符倒置;
將所述標簽信息的長度作為參數傳遞給已訓練的倒置漢字自動識別模型,由所述已訓練的倒置漢字自動識別模型將神經元的output個數設置為與所述標簽信息的長度一致,其中,每個output均為一個二分類分類器;
使用交叉熵之和作為所述已訓練的倒置漢字自動識別模型的損失函數,對所述損失函數進行訓練,直至所述損失函數收斂,輸出識別結果,其中,所述交叉熵的個數與output個數相同。
優選地,所述已訓練的倒置漢字自動識別模型的訓練方法為:
對測試樣本圖像中的各樣本圖像分別進行處理,獲取處理后的各樣本圖像中每個字符的左右邊界,由各樣本圖像中每個字符的左右邊界對各樣本圖像進行分割得到各樣本圖像對應的單字符圖像;
分別生成與各樣本圖像對應的標簽信息,其中,每張樣本圖像的標簽信息采用二進制表示,0表示對應樣本圖像中的單字符圖像中的字符正常,1表示對應樣本圖像中的單字符圖像中的字符倒置;
依次將每張樣本圖像的標簽信息的長度作為參數傳遞給訓練模型,由所述訓練模型根據輸入的標簽信息的長度設置神經元的output個數,其中,每個output均為一個二分類分類器;
使用交叉熵之和作為所述訓練模型的損失函數,對所述訓練模型進行訓練,直至所述訓練模型的輸出正確率滿足預設正確率要求,保存所述訓練模型。
優選地,所述訓練模型為2維卷積神經網絡模型,所述2維卷積神經網絡模型采用多層卷積層加上多層池化層,最后加上一個全連接層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710599718.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:目標檢測方法及裝置
- 下一篇:一種基于神經網絡的字符粘連驗證碼的識別方法





