[發明專利]證件圖片處理的方法和裝置在審
| 申請號: | 202010104574.9 | 申請日: | 2020-02-20 |
| 公開(公告)號: | CN111368840A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 吳昀蓁;熊博穎;易顯維 | 申請(專利權)人: | 中國建設銀行股份有限公司;建信金融科技有限責任公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 張一軍;張效榮 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 證件 圖片 處理 方法 裝置 | ||
本發明公開了證件圖片處理的方法和裝置,涉及計算機技術領域。該方法的一具體實施方式包括:獲取包含多個樣本的樣本集;基于所述樣本集,采用Unet網絡訓練印章過濾模型;基于所述印章過濾模型對含印章的證件圖片進行印章過濾處理。該實施方式能夠在不破壞證件圖片中信息的前提下去除證件圖片中的印章,便于后續識別證件圖片中的欄位。
技術領域
本發明涉及計算機技術領域,尤其涉及一種證件圖片處理的方法和裝置。
背景技術
證件圖片中含有印章時,若印章覆蓋在證件的欄位上,則在做證識別之前需要去除證件圖片中加蓋的印章。現有技術主要使用目標檢測來確定證件圖片中的印章位置,在圖像識別之前根據識別出的印章位置抹掉證件圖片上的印章。
在實現本發明過程中,發明人發現現有技術中至少存在如下問題:
往往會破壞證件圖片中的信息,導致印章位置在經過圖像處理之后會模糊不清。
發明內容
有鑒于此,本發明實施例提供一種證件圖片處理的方法和裝置,能夠在不破壞證件圖片中信息的前提下去除證件圖片中的印章,便于后續識別證件圖片中的欄位。
為實現上述目的,根據本發明實施例的一個方面,提供了一種證件圖片處理的方法,包括:
獲取包含多個樣本的樣本集;
基于所述樣本集,采用Unet網絡訓練印章過濾模型;
基于所述印章過濾模型對含印章的證件圖片進行印章過濾處理。
可選地,獲取包含多個樣本的樣本集,包括:獲取多個不含印章的證件圖片,在每個所述不含印章的證件圖片中添加印章得到含印章的證件圖片;
基于所述樣本集,采用Unet網絡訓練訓練印章過濾模型,包括:以所述含印章的證件圖片作為模型輸入、以所述不含印章的證件圖片作為模型輸出,訓練印章過濾模型。
可選地,在每個所述不含印章的證件圖片中添加印章得到含印章的證件圖片,包括:
采用PS軟件從印章模板圖片中截取印章圖片,利用opencv程序將所述印章圖片添加到每個不含印章的證件圖片中,得到與每個不含印章的證件圖片對應的含印章的證件圖片。
可選地,對含印章的證件圖片進行印章過濾處理之后,還包括:
對證件圖片中的所有像素點進行聚類,得到背景類像素點和前景類像素點,將背景類像素點的像素值置為0、前景類像素點的像素值置為1得到二值化圖像;
采用連通域算法確定所述二值化圖像中的各個連通域以及每個所述連通域的位置信息;
根據預設的證件配置信息以及每個所述連通域的位置信息,確定每個所述連通域對應的欄位。
可選地,采用K-means算法對證件圖片中的所有像素點進行聚類;所述連通域算法為:Two-Pass方法或Seed-Filling方法。
可選地,所述證件配置信息中包括:所述證件圖片中各個欄位的欄位位置信息;
根據預設的證件配置信息以及每個所述連通域的位置信息,確定每個所述連通域對應的欄位,包括:對于任一連通域,將與所述任一連通域的位置信息匹配的欄位位置信息所對應的欄位,作為所述任一連通域的欄位。
可選地,所述證件為身份證。
根據本發明實施例的第二方面,提供一種證件圖片處理的裝置,包括:
樣本獲取模塊,獲取包含多個樣本的樣本集;
模型訓練模塊,基于所述樣本集,采用Unet網絡訓練印章過濾模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司;建信金融科技有限責任公司,未經中國建設銀行股份有限公司;建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010104574.9/2.html,轉載請聲明來源鉆瓜專利網。





