[發明專利]一種模糊、傾斜、帶水印的身份證復印件要素提取方法在審
| 申請號: | 202011390772.2 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112488106A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 袁順杰;徐華建;湯敏偉;李真 | 申請(專利權)人: | 天翼電子商務有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/38;G06T3/00;G06T5/00;G06T5/30;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 102200 北京市昌平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模糊 傾斜 水印 身份證復印件 要素 提取 方法 | ||
1.一種模糊、傾斜、帶水印的身份證復印件要素提取方法,其特征在于,包括以下步驟:
S1:預處理模塊,對輸入的身份證復印件圖片進行預處理,通過一系列數字圖像處理技術,得到證件照在圖中四個頂點的坐標,并根據坐標獲取證照圖;
S2:證照圖的去水印、銳化以及關鍵信息位置定位,利用證照圖關鍵信息的相對關系,得到各個信息的位置,最終得到姓名、性別、民族、出生年月、地址、有效期關鍵信息的確定位置,截取相關位置圖片生成對應信息條目圖片;
S3:文本識別模塊,使用卷積循環神經網絡對每一個信息條目進行識別,首先通過卷積網絡提取條目圖片特征,再利用循環神經網絡提取上下文信息,最終使用CTC模型輸出條目圖片中的文字信息;
S4:識別結果修正,利用全國行政區劃的標準庫和身份證的組合規律,對預測的文本信息進行后處理,得到最終的文本識別結果。
2.根據權利要求1所述的一種模糊、傾斜、帶水印的身份證復印件要素提取方法,其特征在于,所述步驟S1中包含如下:
S1.1對輸入證照圖使用二值化技術突出證照圖的主體輪廓;
S1.2使用腐蝕和膨脹技術去除S1.1中得到的二值化圖中的顆粒噪聲,證照圖位置更加清晰完整;
S1.3利用矩形框檢測技術檢測S1.2步驟得到的圖片,去除掉面積小的矩形,得到證件位置的矩形框及其四個頂點坐標;
S1.4根據四個頂點相對位置,計算證件照傾斜角度,根據傾斜角度做投影仿射變化是矩形水平,得到水平的矩形框;
S1.5根據證件照的像素分布規律,利用特定區域內的像素均值及方差值,判斷證件照的國徽面和人向面。
3.根據權利要求2所述的一種模糊、傾斜、帶水印的身份證復印件要素提取方法,其特征在于,所述步驟S2中包含如下:
S2.1對證照圖進項蛻化操作,以凸顯字跡紋理,提升對模糊圖片的識別率;
S2.2利用條件生成對抗網絡去除證照圖中的水印,得到去除水印后的證照圖;
S2.3根據證件照各個模塊的相對位置,確定需要提取關鍵信息的條目區域,最后將一個證照圖分成了多個只包含關鍵文字信息的區域圖。
4.根據權利要求3所述的一種模糊、傾斜、帶水印的身份證復印件要素提取方法,其特征在于,所述步驟S3中包含如下:
S3.1將S2.3步驟中得到的區域圖調整為高度為32像素的圖片,并將圖片輸入到卷積神經網絡中提取特征,得到對應圖片的二維張量;
S3.2使用雙向循環神經網絡對S3.1步驟中得到的張量進行上下文分析,進而使用一個全連接層預測固定寬度內屬于某個字符的概率,再轉義為輸出字符;
S3.3最后使用CTC算法對S3.2步驟得到的字符進行對齊去重,得到模型的輸出文本。
5.根據權利要求1所述的一種模糊、傾斜、帶水印的身份證復印件要素提取方法,其特征在于,所述步驟S4中包含如下:
S4.1“證件照”和“生日”的修正,利用證件號第7位到第14位為出生年月的規則,取預測概率更大的一組進行修正;
S4.2“住址”和“簽發機關”修正,利用官方發布的全國行政區劃表,計算預測住址和預測簽發機關與標準行政區劃的編輯距離,取編輯距離最小的行政區劃地址;
S4.3“有效期”修正,利用證件照有效期為5年、10年、20年和長期,對有效期年月日進行修正。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天翼電子商務有限公司,未經天翼電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011390772.2/1.html,轉載請聲明來源鉆瓜專利網。





