[發明專利]標準證照中結構化信息定位提取方法、系統、終端及介質在審
| 申請號: | 202211464435.2 | 申請日: | 2022-11-22 |
| 公開(公告)號: | CN115797933A | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 姜華;顧王一 | 申請(專利權)人: | 江西思賢數據科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/146;G06V30/148;G06V30/414 |
| 代理公司: | 上海恒慧知識產權代理事務所(特殊普通合伙) 31317 | 代理人: | 徐紅銀;劉翠 |
| 地址: | 330108 江西省南昌市紅谷灘區九龍大道1388*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標準 證照 結構 信息 定位 提取 方法 系統 終端 介質 | ||
1.一種標準證照中結構化信息定位提取方法,其特征在于,包括:
構建標準證照結構化信息配置文件;
獲取實際標準證照圖片,對所述實際標準證照圖片進行OCR識別,得到OCR圖片;
利用所述標準證照結構化信息配置文件,對所述OCR圖片中得到的文本框進行定位,得到相應位置上的關鍵詞以及與所述關鍵詞相對應的關鍵內容,完成對標準證照中結構化信息定位提取。
2.根據權利要求1所述的標準證照中結構化信息定位提取方法,其特征在于,所述構建標準證照結構化信息配置文件,包括:
選擇參考圖片;
對所述參考圖片上的文字位置進行定位,并對所述參考圖片上關鍵詞和關鍵內容的位置進行標注,得到初步配置文件;
在所述初步配置文件中加入輔助信息,并存儲為json格式,得到標準證照結構化信息配置文件。
3.根據權利要求2所述的標準證照中結構化信息定位提取方法,其特征在于,還包括如下任意一項或任意多項:
-所述參考圖片選擇正立的、沒有明顯角度傾斜的圖片;
-所述對所述參考圖片上關鍵詞和關鍵內容的位置進行標注,其中:對于所述關鍵詞,所述標注框緊密包圍所述關鍵詞;對于所述關鍵內容,所述標注框框住所述關鍵內容的所在范圍即可;
-所述輔助信息,包括:
layout,用于描述標準證照的版面格式;
location,用于描述從原始圖像中截取的有效圖片區域;
key,用于描述關鍵詞信息,并設定關鍵詞定義規則;
value,用于描述關鍵內容信息;
anchors,用于在同一個關鍵詞key在同類材料中描述不同時,構建表示同一個關鍵詞含義的列表,所述列表包括關鍵詞信息和關鍵詞位置信息;
index,用于在同一材料中存在多個關鍵詞key時,按照設定的排序規則,對多個關鍵詞key依次排序;
key_loc,用于描述關鍵詞key的絕對位置坐標;
val_loc,用于描述關鍵內容value的絕對位置坐標。
4.根據權利要求1-3中任一項所述的標準證照中結構化信息定位提取方法,其特征在于,所述利用所述標準證照結構化信息配置文件,對所述OCR圖片中得到的文本框進行定位,得到相應位置上的關鍵詞以及與所述關鍵詞相對應的關鍵內容,包括:
利用所述標準證照結構化信息配置文件中的版面格式信息,對所述OCR圖片中的文本框進行排序;
利用所述標準證照結構化信息配置文件中的有效圖片區域信息,獲取所述OCR圖片中文本框所在的有效文本框區域;
利用所述標準證照結構化信息配置文件中的關鍵詞信息,將所述有效文本框區域中對應關鍵詞和關鍵內容的文本框進行分割;
利用所述標準證照結構化信息配置文件中的關鍵詞位置信息,在所述文本框中找到關鍵詞所在的位置,并利用所述標準證照結構化信息配置文件中的關鍵詞定義規則,排除重名的關鍵詞之間的干擾;
根據所述有效文本框區域中所有已知關鍵詞的位置,結合所述標準證照結構化信息配置文件中的關鍵詞的絕對位置坐標和關鍵內容的絕對位置坐標,預測得到對應關鍵內容的位置,進而得到與相應位置上的關鍵詞相對應的關鍵內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西思賢數據科技有限公司,未經江西思賢數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211464435.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種API接口加密簽名方法
- 下一篇:一種污水處理用沉淀池
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





