[發明專利]一種識別證件的方法和裝置在審
| 申請號: | 202110279229.3 | 申請日: | 2021-03-16 |
| 公開(公告)號: | CN113011426A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 楊勇;馬倩;洪學海 | 申請(專利權)人: | 上饒市中科院云計算中心大數據研究院 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/20;G06K9/40;G06K9/46 |
| 代理公司: | 北京科家知識產權代理事務所(普通合伙) 11427 | 代理人: | 張勛 |
| 地址: | 334000 江西*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 證件 方法 裝置 | ||
本申請實施例公開了一種識別證件的方法和裝置,其中方法包括步驟:確認目標圖像與模板圖像屬于同一類證件圖像;在所述模板圖像中截取區域子模板圖像,將所述區域子模板與目標圖像進行匹配達到查找目標圖像中相應的區域,根據位置偏移參數截取目標圖像中待識別區域圖像;對所述待識別區域圖像進行光學識別并提取文本信息。本申請實施例提供的識別證件的方法,該方法只需要少量或極少量的模板圖像,且無需訓練,識別速度快、準確率高。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種識別證件的方法和裝置。
背景技術
隨著互聯網技術的高速發展,越來越多的應用場景需要利用圖像中的文本信息,尤其是讀取證件中的文本信息。目前,流行的證件文本信息提取方法為基于深度學習的光學字符識別(Optical Character Recognition,OCR)技術,該技術具有準確率高、識別信息量大等優點,然而基于深度學習的OCR識別技術需要大量證件圖像做訓練,同時訓練過程耗費大量人力、物力,有些甚至用速度換精度,速度超過10s以上。
計算機文字識別,俗稱光學字符識別(Optical Character Recogn ition,OCR),它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,并轉換成一種計算機能夠接受、人又可以理解的格式。OCR技術是實現文字高速錄入的一項關鍵技術。Tesseract的OCR引擎最先由HP實驗室于1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。數年以后,HP將Tesseract貢獻給開源軟件業,讓其重煥新生,直至2005年,Tesseract由美國內華達州信息技術研究所獲得,并求諸于Google對Tesseract進行改進、消除Bug、優化工作。Tesseract目前已作為開源項目發布在Google Project,其最新版本3.0已經支持中文OCR,并提供了一個命令行工具。
發明內容
本申請的目的在于提供一種識別證件的方法,該方法只需要少量或極少量的模板圖像,且無需訓練,識別速度快、準確率高。
本申請提供的一種識別證件的方法,包括步驟:首先,確認目標圖像與模板圖像屬于同一類證件圖像;接著,在所述模板圖像中截取區域子模板圖像,將所述區域子模板與目標圖像進行匹配達到查找目標圖像中相應的區域,根據位置偏移參數截取目標圖像中待識別區域圖像;最后,對所述待識別區域圖像進行光學識別并提取文本信息。
一種可選的實施方式中,所述確認目標圖像與模板圖像屬于同一類證件圖像包括步驟:采用SIFT特征點檢測分析圖像,然后基于FLANN的匹配器定位圖片,來達到對比目標圖像是否與模板圖像屬于同一類證件,如果是同一類證件圖像則進入下一步處理,否則提示用戶重新上傳圖片。
一種可選的實施方式中,所述確認目標圖像與模板圖像屬于同一類證件圖像之后還包括步驟:對目標圖像進行圖像預處理,包括但不限于圖像矯正、圖像歸一化、直方圖處理和灰度處理。
一種可選的實施方式中,通過flash服務器通過http請求接收所述目標圖像。
一種可選的實施方式中,所述對所述待識別區域圖像進行光學識別并提取文本信息之前還包括步驟:對待識別區域圖像進行非局部平均去噪處理;進行固定閾值二值化處理;查找檢測物體輪廓,并描邊、繪制出圖像輪廓;根據待識別文本長度過濾圖像;使用Tesseract-OCR對待識別區域圖像進行文本識別,完成文本信息的提取并返回給用戶。
第二方面,本申請實施例還提供了一種識別證件的裝置,該裝置具體包括:
校驗單元,用于確認目標圖像與模板圖像屬于同一類證件圖像;
截取單元,用于在所述模板圖像中截取區域子模板圖像,將所述區域子模板與目標圖像進行匹配達到查找目標圖像中相應的區域,根據位置偏移參數截取目標圖像中待識別區域圖像;
識別單元,用于對所述待識別區域圖像進行光學識別并提取文本信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上饒市中科院云計算中心大數據研究院,未經上饒市中科院云計算中心大數據研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110279229.3/2.html,轉載請聲明來源鉆瓜專利網。





