[發明專利]一種身份證文字提取方法、系統及設備和存儲介質在審
| 申請號: | 201810022673.5 | 申請日: | 2018-01-10 |
| 公開(公告)號: | CN108154132A | 公開(公告)日: | 2018-06-12 |
| 發明(設計)人: | 梁棟;趙立軍 | 申請(專利權)人: | 馬上消費金融股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/32;G06K9/34 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 401121 重慶市渝北區*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字輪廓 文字提取 身份證圖像 身份證 感興趣區域 系統及設備 定位信息 計算機可讀存儲介質 人臉識別技術 輸入字符識別 存儲介質 二維平面 輪廓分析 拍攝圖像 限定條件 準確定位 字段信息 字符識別 準確率 人臉 引擎 合并 分割 分類 | ||
本發明公開了一種身份證文字提取方法、系統及設備和一種計算機可讀存儲介質,該方法包括:獲取身份證圖像,并根據所述身份證圖像獲取人臉的定位信息;根據所述定位信息提取所述身份證圖像中的感興趣區域;在所述感興趣區域內獲取文字輪廓,并根據所述文字輪廓的位置對所述文字輪廓按行進行分類;將同一類的所述文字輪廓合并為整行文字輪廓,并將所有的所述整行文字輪廓輸入字符識別引擎中得到文字提取結果。本發明提供的身份證文字提取方法,采用人臉識別技術使得拍攝圖像時對環境的要求大大降低,減少了限定條件,提高了分割定位精度。同時,采用輪廓分析充分利用二維平面信息,更準確定位字段信息,提高了身份證字符識別的準確率。
技術領域
本發明涉及字符識別領域,更具體地說,涉及一種身份證文字提取方法、系統及設備和一種計算機可讀存儲介質。
背景技術
身份證字符識別是計算機視覺技術的一類重要應用,該技術通過圖像處理算法,自動識別身份證上載明的各類信息,如姓名、性別、住址、民族、身份證號碼、證件有效期等,這類技術在各行各業有著廣泛應用和潛在需求。目前身份證識別方法流程主要是采圖像預處理、圖像校正、感興趣區域分割、字符識別等,在實際環境中,照片背景與身份證圖片區域的分割以及分割后的字段分析會對識別效果產生較大影響。
現有技術中的身份證照片背景分離技術多采用限定采集環境的方式,將身份證置于比較簡單的背景下采集照片,對光照和攝像頭有一定限制,用戶體驗感較差。
現有技術在字段提取時,采用圖像水平方向投影進行字段分割,通過分析投影結果判斷身份證信息字段,字段分割容易受到傾斜和污點的干擾,投影過程是將二維平面像素數據投影到一維直線上,損失了空間分布信息,導致字符識別不準確。
因此,如何提高身份證字符識別的準確率是本領域技術人員需要解決的問題。
發明內容
本發明的目的在于提供一種身份證文字提取方法、系統及設備和一種計算機可讀存儲介質,提高了身份證字符識別的準確率。
為實現上述目的,本發明提供了一種身份證文字提取方法,包括:
獲取身份證圖像,并根據所述身份證圖像獲取人臉的定位信息;
根據所述定位信息提取所述身份證圖像中的感興趣區域;
在所述感興趣區域內獲取文字輪廓,并根據所述文字輪廓的位置對所述文字輪廓按行進行分類;
將同一類的所述文字輪廓合并為整行文字輪廓,并將所有的所述整行文字輪廓輸入字符識別引擎中得到文字提取結果。
其中,所述獲取身份證圖像之后,還包括:
對所述身份證圖像進行縮放處理。
其中,根據所述定位信息提取所述身份證圖像中的感興趣區域,包括:
根據所述定位信息獲取所述身份證的基準定位;
根據所述基準定位提取所述身份證圖像中的感興趣區域,并對所述感興趣區域進行校正操作。
其中,在所述感興趣區域內獲取文字輪廓,包括:
將所述感興趣區域按灰度等級分為黑色部分和白色部分,并檢測文字輪廓。
其中,根據所述文字輪廓的位置對所述文字輪廓按行進行分類,包括:
獲取所述文字輪廓的中心點縱坐標,將所述中心點縱坐標的差值小于預設值的相鄰文字輪廓歸為一類。
其中,所述將同一類的所述文字輪廓合并為整行文字輪廓之前,還包括:
篩選所有的所述文字輪廓,以便剔除誤差輪廓。
為實現上述目的,本發明提供了一種身份證文字提取系統,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于馬上消費金融股份有限公司,未經馬上消費金融股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810022673.5/2.html,轉載請聲明來源鉆瓜專利網。





