[發明專利]驗證碼的識別方法、裝置、電子設備和存儲介質在審
| 申請號: | 202011372546.1 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112989312A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 劉陽 | 申請(專利權)人: | 北京金堤科技有限公司 |
| 主分類號: | G06F21/36 | 分類號: | G06F21/36;G06K9/62;G06N3/08 |
| 代理公司: | 北京康盛知識產權代理有限公司 11331 | 代理人: | 董娣 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 驗證 識別 方法 裝置 電子設備 存儲 介質 | ||
本公開的實施例提供了驗證碼的識別方法和裝置、計算機可讀存儲介質和電子設備。該方法包括:采集當前業務的驗證碼的圖像,建立圖像集合;針對圖像集合中每張圖像進行標注,得到的標注信息可詮釋對應圖像中每個目標圖標所屬類別和在圖像中的位置,以及每個點擊圖標所屬類別和在圖像中的位置;神經網絡模型通過圖像集合中的圖像和對應標注信息進行深度學習;利用深度學習后的神經網絡模型對待識別的驗證碼進行識別。本發明通過深度學習模型實現驗證碼的定位和分類識別能力,可以有效提升驗證碼的識別效率及準確度,且提升安全性。
技術領域
本發明涉及圖像識別技術領域,尤其涉及驗證碼的識別方法、裝置、電 子設備和存儲介質。
背景技術
隨著網絡的快速發展,驗證碼技術在網絡安全方面起到了越來越重要的 作用,在驗證碼識別的安全測試中,需要快速進行驗證碼的通過來實現高速 的數據采集能力,但由于驗證碼的復雜程度越來越高,由最簡單的數字驗證 碼,到字符驗證碼,滑動驗證碼,再到更為復雜的字符點選驗證碼和Icon圖 標點選驗證碼等,特別是Icon圖標點選驗證碼,對于識別要求相對較高, Icon圖標具有和背景圖更強的融合能力,和更復雜的識別干擾,在驗證碼識 別過程中識別難度大,過程復雜。而現有技術往往是針對較為簡單的字符驗 證碼進行校驗識別,對于復雜性相對較高的驗證碼,如Icon圖標驗證碼的識 別因難度較大通常效率較低且準確度不高。
發明內容
本公開的目的在于提供驗證碼的識別方法、裝置、電子設備和存儲介 質,進而至少在一定程度上解決現有技術中復雜驗證碼識別效率較低且準確 度不高的技術問題。
本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通 過本公開的實踐而習得。
根據本公開的第一方面,驗證碼的識別方法,包括:
采集驗證碼的圖像,建立圖像集合;每張圖像中都顯示有至少一個目標 圖標和至少一個點擊圖標;每個目標圖標唯一對應一個點擊圖標;
針對圖像集合中每張圖像進行標注,得到的標注信息可詮釋對應圖像中 每個目標圖標所屬類別和在圖像中的位置,以及每個點擊圖標所屬類別和在 圖像中的位置;同一圖像中唯一對應的目標圖標和點擊圖標的類別相同;
神經網絡模型通過圖像集合中的圖像和對應標注信息進行深度學習;深 度學習后的神經網絡模型可識別每張圖像中每個目標圖標和點擊圖標的所屬 類別和在圖像中的位置;
利用深度學習后的神經網絡模型對待識別的驗證碼進行識別。
在本公開的示例性實施例中,所述神經網絡模型通過圖像集合中的圖像 和對應標注信息進行深度學習,具體包括:
根據圖像集合中標注過的圖像,構建數據集;所述數據集中每條數據都 包括一張圖像和對應的標注信息;
從數據集中提取訓練集,并將訓練集輸入至神經網絡模型進行訓練,從 而調整神經網絡模型的普通參數;
通過評價值對神經網絡模型的訓練結果進行評價;
當評價值滿足預設條件后,停止訓練,保存當前訓練后的神經網絡模 型。
進一步,所述根據圖像集合中標注過的圖像,構建數據集,之后還包 括:
將數據集中的各數據進行格式轉換,得到神經網絡模型可辨認處理的數 據集。
進一步,所述從數據集中提取訓練集,并將訓練集輸入至神經網絡模型 進行訓練,之后還包括:
從數據集中提取驗證集,所述驗證集與訓練集無交集;
在神經網絡模型的訓練過程中利用驗證集調整神經網絡模型的超參數。
進一步,所述保存當前訓練后的神經網絡模型,之后還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金堤科技有限公司,未經北京金堤科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011372546.1/2.html,轉載請聲明來源鉆瓜專利網。





