[發明專利]標準證照中結構化信息定位提取方法、系統、終端及介質在審
| 申請號: | 202211464435.2 | 申請日: | 2022-11-22 |
| 公開(公告)號: | CN115797933A | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 姜華;顧王一 | 申請(專利權)人: | 江西思賢數據科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/146;G06V30/148;G06V30/414 |
| 代理公司: | 上海恒慧知識產權代理事務所(特殊普通合伙) 31317 | 代理人: | 徐紅銀;劉翠 |
| 地址: | 330108 江西省南昌市紅谷灘區九龍大道1388*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標準 證照 結構 信息 定位 提取 方法 系統 終端 介質 | ||
本發明提供了一種標準證照中結構化信息定位提取方法及系統,包括:構建標準證照結構化信息配置文件;獲取實際標準證照圖片,對所述實際標準證照圖片進行OCR識別,得到OCR圖片;利用所述標準證照結構化信息配置文件,對所述OCR圖片中得到的文本框進行定位,得到相應位置上的關鍵詞以及與所述關鍵詞相對應的關鍵內容,完成對標準證照中結構化信息定位提取。同時提供了一種相應的終端及介質。本發明能夠快速完成對新證照的提取支持、解決粘連問題以及同類型關鍵詞內容的歸屬問題。
技術領域
本發明涉及圖像處理技術領域,具體地,涉及一種標準證照中結構化信息定位提取方法、系統、終端及介質。
背景技術
隨著計算機技術的發展,對于常用證件(包括身份證、行駛證、護照、結婚證等)的證件信息采集及應用在日常工作、生活中起到了重要作用。證件識別代替手工錄入,提升了工作速度,提高了辦事效率。
授權公告號為CN113313113B的中國發明專利《證件信息獲取方法、裝置、設備以及存儲介質》,對目標證件圖像進行文本識別,確定文本識別結果;根據文本識別結果,在目標證件圖像中確定至少一個預設類型的字段所處的目標區域;對目標區域進行字符識別,確定字符識別結果;融合文本識別結果和字符識別結果,確定以及輸出目標證件圖像的文本信息。該專利技術存在如下技術問題:
1、類別是預先固定的,對新的材料缺乏適應性,需要重新訓練分類模型,效率低,且需要專業知識輔助和特殊硬件的支持,在真實應用時,普通用戶無法采用。
2、直接對文本進行向量化,這里的前提假設文字識別的結果是關鍵詞和關鍵內容是分離的,但在實際應用中,這個假設往往是不成立的。
3.、對于同類型的關鍵內容,無法從向量上區分,比如結婚證上有男女雙方的信息,幾個名字是無法單純從向量上區分的。
發明內容
本發明針對現有技術中存在的上述不足,提供了一種標準證照中結構化信息定位提取方法、系統、終端及介質。
根據本發明的一個方面,提供了一種標準證照中結構化信息定位提取方法,包括:
構建標準證照結構化信息配置文件;
獲取實際標準證照圖片,對所述實際標準證照圖片進行OCR識別,得到OCR圖片;
利用所述標準證照結構化信息配置文件,對所述OCR圖片中得到的文本框進行定位,得到相應位置上的關鍵詞以及與所述關鍵詞相對應的關鍵內容,完成對標準證照中結構化信息定位提取。
可選地,所述構建標準證照結構化信息配置文件,包括:
選擇參考圖片;
對所述參考圖片上的文字位置進行定位,并對所述參考圖片上關鍵詞和關鍵內容的位置進行標注,得到初步配置文件;
在所述初步配置文件中加入輔助信息,并存儲為json格式,得到標準證照結構化信息配置文件。
可選地,所述參考圖片選擇正立的、沒有明顯角度傾斜的圖片。
可選地,所述對所述參考圖片上關鍵詞和關鍵內容的位置進行標注,其中:對于所述關鍵詞,所述標注框緊密包圍所述關鍵詞;對于所述關鍵內容,所述標注框框住所述關鍵內容的所在范圍即可。
可選地,所述輔助信息,包括:
layout,用于描述標準證照的版面格式;
location,用于描述從原始圖像中截取的有效圖片區域;
key,用于描述關鍵詞信息,并設定關鍵詞定義規則;
value,用于描述關鍵內容信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西思賢數據科技有限公司,未經江西思賢數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211464435.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種API接口加密簽名方法
- 下一篇:一種污水處理用沉淀池
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





