[發明專利]圖片驗證碼識別方法及裝置、電子設備和計算機可讀介質在審
| 申請號: | 202010439520.8 | 申請日: | 2020-05-22 |
| 公開(公告)號: | CN111611988A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 魏小文;何曉力;李可瑋;孫晨陽;黃小云;張蕓蜻 | 申請(專利權)人: | 上海攜程商務有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34;G06N3/04;G06N3/08;H04L29/06 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 驗證 識別 方法 裝置 電子設備 計算機 可讀 介質 | ||
本發明公開了一種圖片驗證碼識別方法及裝置、電子設備和計算機可讀介質,圖片驗證碼識別方法包括以下步驟:獲取原始圖片,原始圖片為原始的驗證碼圖片,驗證碼圖片包含若干字符;對原始圖片進行預處理;獲取原始圖片中單個字符對應的圖片,標記成樣本;構建卷積神經網絡模型;采用樣本訓練卷積神經網絡模型,以使得卷積神經網絡模型輸出對樣本的預測值且輸出預測值的準確率大于準確率閾值;采用訓練后的卷積神經網絡模型識別圖片驗證碼。本發明通過有效的卷積神經網絡模型來自動識別并預測圖片驗證碼,從而極大地提升了圖片字的識別準確率和識別效率,而且極大地降低了成本和響應時間。
技術領域
本發明涉及機器學習技術領域,特別涉及一種基于卷積神經網絡模型的圖片驗證碼識別方法及裝置、電子設備和計算機可讀介質。
背景技術
目前,圖片驗證碼在網站注冊、登陸等情況下得到廣泛應用,使用時,圖片驗證碼中通常顯示有若干字符(如4個,包括數字、字母等),通過驗證用戶輸入的字符與圖片驗證碼中顯示的字符是否一致,來決定用戶是否具有注冊、登陸網站等權限。現階段,傳統的驗證碼識別方案有:
(1)人工識別,利用人力識別出圖片驗證碼中的字符,這種方案的缺點是費時費力,人力成本大;
(2)采用傳統的圖片識別技術,對圖片驗證碼進行圖像處理、通過計算字符相似度等手段識別字符,這種方案的缺點是成功率低,耗時長。
發明內容
本發明要解決的技術問題是為了克服現有技術中采用人工識別圖片驗證碼而導致費時費力、人力成本大,且采用傳統的圖片識別技術識別圖片驗證碼而導致成功率低、耗時長的缺陷,提供一種圖片驗證碼識別方法及裝置、電子設備和計算機可讀介質。
本發明是通過下述技術方案來解決上述技術問題:
一種圖片驗證碼識別方法,包括以下步驟:
獲取原始圖片,所述原始圖片為原始的驗證碼圖片,所述驗證碼圖片包含若干字符;
對所述原始圖片進行預處理;
獲取所述原始圖片中單個字符對應的圖片,標記成樣本;
構建卷積神經網絡模型;
采用所述樣本訓練所述卷積神經網絡模型,以使得所述卷積神經網絡模型輸出對所述樣本的預測值且輸出所述預測值的準確率大于準確率閾值;
采用訓練后的卷積神經網絡模型識別圖片驗證碼。
可選地,對所述原始圖片進行預處理的步驟包括:
將所述原始圖片轉化為灰度圖片;
對所述灰度圖片二值化,以區分所述灰度圖片中的有效信息和無效信息;
將二值化后的灰度圖片分割成單個字符對應的圖片。
可選地,將二值化后的灰度圖片分割成單個字符對應的圖片的步驟包括:
腐蝕:將所述灰度圖片中的有效信息用255填充;
垂直投影統計每列有效像素個數;
遍歷圖片寬度,根據每列像素個數動態設定閾值,獲取水平位置分割點;
分割字符;
判斷分割后的字符寬度是否大于字符寬度閾值,若是,則繼續分割,直至分割后的字符寬度小于或等于所述字符寬度閾值,所述字符寬度閾值等于字符平均寬度加上隨機值,所述字符平均寬度等于所述原始圖片的寬度除以所包含的字符總數。
可選地,所述卷積神經網絡模型包括3個卷積層、4個激活函數、3個池化層、4個權值衰減層和2個全連接層中的任意一種或多種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海攜程商務有限公司,未經上海攜程商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010439520.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:磁保持繼電器及其工作方法
- 下一篇:一種超時報警方法、裝置及存儲介質





