[發明專利]基于深度學習的卡證圖像識別方法有效
| 申請號: | 201911184481.5 | 申請日: | 2019-11-27 |
| 公開(公告)號: | CN110909809B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | 崔淼 | 申請(專利權)人: | 上海智臻智能網絡科技股份有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/776;G06V10/80;G06V10/82;G06N3/0442;G06N3/0464 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 圖像 識別 方法 | ||
本發明提供一種基于深度學習的卡證圖像識別方法,包括:獲取待處理的卡證圖像;采用深度學習的分類網絡對所述卡證圖像進行分類處理,獲取所述卡證圖像中的目標區域;對所述目標區域進行特征提取處理,獲取所述目標區域的特征數據;對所述特征數據進行識別處理,獲取識別信息。由于增加了分類處理,使得后續的特征提取處理以及識別處理僅是針對目標區域,無需對整個卡證圖像上的信息進行識別,從而既可以減少識別所用的時間,提高識別速度,即提高識別效率;又可以免受背景花紋的干擾影響,減少漏識別和錯識別,即提高識別準確率,最終大大提高識別效果。
技術領域
本發明涉及圖像處理技術領域,尤其涉及一種基于深度學習的卡證圖像識別方法。
背景技術
近幾年來我國互聯網金融飛速發展,網上資金交易逐漸成為日常生活中的主流消費方式。隨著移動互聯的發展,商業移動應用越來越多,移動支付成為最主流的支付方式之一,這些商業移動應用很多涉及到個人銀行卡賬戶,身份證的綁定,而實際不論客戶辦理業務還是工作人員錄入客戶信息業務都需要手動號碼、身份證號碼、驗證碼,手機號碼。這種方式速度慢,易出錯,用戶體驗非常差。
目前,基于計算機視覺的光學字符識別(Optical?Character?Recognition,OCR),已經被廣泛應用于商業領域,如常見的身份證、銀行卡、發票、工作證、學生證、護照、駕駛證識別等。現有技術中,OCR包括預處理、檢測處理與識別處理三個步驟,其中:預處理主要包括二值化、圖像降噪、傾斜矯正、平滑、銳化等,其作用主要是消除圖像中冗余的信息,恢復有用的真是信息,增強有關信息的可檢測性和最大限度地簡化數據,從而改進后續處理的可靠性;檢測處理一般采用VGG或殘差網絡,其會對圖像中所有文字進行檢測;識別處理一般采用雙向LSTM(Long?Short-Term?Memory,長短期記憶網絡)模型和CTC(ConnectionistTemporal?Classification,連接時序分類)模型,其通過對檢測到的信息進行識別,最終得到識別結果,即身份證號、銀行卡號、發票號、駕駛證號等信息。
但是目前應用上述方式得到的卡證信息的準確率不高同時識別結果容易受到背景、光照等因素干擾,且識別所用的時間也比較長,因此如何同時提高卡證信息的準確率以及減少識別所用的時間就成為本領域技術人員亟待解決的問題之一。
發明內容
本發明解決的問題是提供一種基于深度學習的卡證圖像識別方法,既可以提高識別效率,又可以提高識別準確率,最終提高用戶體驗效果。
為解決上述問題,本發明實施例提供一種基于深度學習的卡證圖像識別方法,包括以下步驟:
獲取待處理的卡證圖像;
采用深度學習的分類網絡對所述卡證圖像進行分類處理,獲取所述卡證圖像中的目標區域;
對所述目標區域進行特征提取處理,獲取所述目標區域的特征數據;
對所述特征數據進行識別處理,獲取識別信息。
可選地,所述待處理的卡證圖像是身份證圖像、銀行卡圖像、發票圖像、工作證圖像、學生證圖像、護照圖像或駕駛證圖像。
可選地,所述分類處理采用的網絡包括五層卷積,所述目標區域為待識別的卡證號碼區域。
可選地,所述特征提取處理依次包括:深度可分離卷積處理、具有線性瓶頸的倒殘差結構的深度學習模型、基于squeeze?and?excitation結構的輕量級注意力深度學習模型。
可選地,所述方法還包括:在進行特征提取處理的過程中進行特征融合處理,所述特征融合處理采用空洞卷積方式實現。
可選地,所述識別處理依次包括以下三個處理:
密集連接的卷積網絡(Densely?Connected?Convolutional?Networks,簡稱DenseNet);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智臻智能網絡科技股份有限公司,未經上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911184481.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





