[發明專利]字符驗證碼識別模型訓練方法、識別方法、系統、設備及介質在審
| 申請號: | 202011238297.7 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112270325A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 魏小文;何曉力;李可瑋;張蕓蜻;孫晨陽;黃小云 | 申請(專利權)人: | 攜程旅游網絡技術(上海)有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06N3/04;G06N3/08;G06N20/20 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 楊東明;余中燕 |
| 地址: | 200335*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 驗證 識別 模型 訓練 方法 系統 設備 介質 | ||
本發明提供一種字符驗證碼識別模型訓練方法、識別方法、系統、設備及介質,該訓練方法包括:建立標準字符類別庫,其中包含若干字符及與各字符對應的類別向量;獲取若干字符驗證碼樣本圖像,并以相應圖像中包含的字符命名;通過字符位置預測模型獲取各字符驗證碼樣本圖像中每個字符的目標位置偏移量;將各字符驗證碼樣本圖像的名稱中的字符與標準字符類別庫中的字符進行匹配,以獲取各字符驗證碼樣本圖像中的字符的目標類別向量;根據各字符驗證碼樣本圖像中每個字符的目標類別向量和目標位置偏移量,對字符驗證碼識別模型進行訓練,得到目標字符驗證碼識別模型。本發明能夠提高字符驗證碼識別的準確率和效率,同時提高訓練樣本的生成效率。
技術領域
本發明涉及深度學習領域,尤其涉及一種字符驗證碼識別模型訓練方法、識別方法、系統、設備及介質。
背景技術
驗證碼是一種區分用戶是計算機還是人的公共全自動程序。字符驗證碼被廣泛應用于互聯網服務中,作為判斷網絡請求是否來自合法用戶的工具,從而防范機器的大量自動請求,保障網站服務器的穩定運行。字符驗證碼是目前最常被使用的一類驗證碼。該類驗證碼通常需要用戶完成一個文字識別任務,用戶需要正確識別出由計算機圖像技術生成的字符圖像中的各個字符以通過驗證。為了提高機器識別驗證碼的難度,該類驗證碼的圖像中通常會伴隨有噪點、干擾線等作為干擾。此外,一些驗證碼采用中文字符作為待識別字符。由于中文字符的筆劃較多,線條結構較為復雜,傳統圖像識別方法難以有效地將字符前景與干擾背景分割開來,導致識別成功率低,耗時長。此外,傳統圖像識別方法往往依賴大量的標注數據進行訓練,每一張圖像由人工標注、核驗,整個過程費時費力,且耗費大量的資金。
發明內容
針對上述現有技術的不足,本發明的目的在于提供一種字符驗證碼識別模型訓練方法、識別方法、系統、設備及介質,以提高字符驗證碼識別的準確率和效率,同時提高訓練樣本的生成效率。
為了實現上述目的,本發明提供一種字符驗證碼識別模型訓練方法,包括:
建立標準字符類別庫,所述標準字符類別庫中包含若干字符以及與各字符對應的類別向量;
獲取若干字符驗證碼樣本圖像,各所述字符驗證碼樣本圖像以相應圖像中包含的字符命名;
通過預先訓練的字符位置預測模型獲取各所述字符驗證碼樣本圖像中每個字符的目標位置偏移量;
將各所述字符驗證碼樣本圖像的名稱中的字符與所述標準字符類別庫中的字符進行匹配,以獲取各所述字符驗證碼樣本圖像中的字符的目標類別向量;
根據各所述字符驗證碼樣本圖像中每個字符的目標類別向量和目標位置偏移量,對字符驗證碼識別模型進行訓練,得到目標字符驗證碼識別模型。
在本發明一個優選實施例中,所述建立標準字符類別庫的步驟包括:
獲取若干第一字符驗證碼圖像,各所述第一字符驗證碼圖像以相應圖像中包含的字符命名;
對所述若干第一字符驗證碼圖像的名稱中包含的字符進行預處理,得到若干目標字符;
根據各所述目標字符以及各目標字符對應的類別向量建立所述標準字符類別庫。
在本發明一個優選實施例中,所述對所述若干第一字符驗證碼圖像的名稱中包含的字符進行預處理,得到若干目標字符的步驟,包括:
對所述若干第一字符驗證碼圖像的名稱中包含的字符進行去重處理;
統計所述若干第一字符驗證碼圖像的名稱中包含的各字符出現的頻率,并過濾頻率低于預定閾值的字符;
將去重和過濾后,所述若干第一字符驗證碼圖像的名稱中剩余的字符作為所述目標字符。
在本發明一個優選實施例中,所述字符位置預測模型的訓練過程如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程旅游網絡技術(上海)有限公司,未經攜程旅游網絡技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011238297.7/2.html,轉載請聲明來源鉆瓜專利網。





