[發(fā)明專利]標(biāo)準(zhǔn)證照中結(jié)構(gòu)化信息定位提取方法、系統(tǒng)、終端及介質(zhì)在審
| 申請?zhí)枺?/td> | 202211464435.2 | 申請日: | 2022-11-22 |
| 公開(公告)號: | CN115797933A | 公開(公告)日: | 2023-03-14 |
| 發(fā)明(設(shè)計)人: | 姜華;顧王一 | 申請(專利權(quán))人: | 江西思賢數(shù)據(jù)科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/146;G06V30/148;G06V30/414 |
| 代理公司: | 上海恒慧知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 31317 | 代理人: | 徐紅銀;劉翠 |
| 地址: | 330108 江西省南昌市紅谷灘區(qū)九龍大道1388*** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)準(zhǔn) 證照 結(jié)構(gòu) 信息 定位 提取 方法 系統(tǒng) 終端 介質(zhì) | ||
1.一種標(biāo)準(zhǔn)證照中結(jié)構(gòu)化信息定位提取方法,其特征在于,包括:
構(gòu)建標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件;
獲取實際標(biāo)準(zhǔn)證照圖片,對所述實際標(biāo)準(zhǔn)證照圖片進(jìn)行OCR識別,得到OCR圖片;
利用所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件,對所述OCR圖片中得到的文本框進(jìn)行定位,得到相應(yīng)位置上的關(guān)鍵詞以及與所述關(guān)鍵詞相對應(yīng)的關(guān)鍵內(nèi)容,完成對標(biāo)準(zhǔn)證照中結(jié)構(gòu)化信息定位提取。
2.根據(jù)權(quán)利要求1所述的標(biāo)準(zhǔn)證照中結(jié)構(gòu)化信息定位提取方法,其特征在于,所述構(gòu)建標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件,包括:
選擇參考圖片;
對所述參考圖片上的文字位置進(jìn)行定位,并對所述參考圖片上關(guān)鍵詞和關(guān)鍵內(nèi)容的位置進(jìn)行標(biāo)注,得到初步配置文件;
在所述初步配置文件中加入輔助信息,并存儲為json格式,得到標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件。
3.根據(jù)權(quán)利要求2所述的標(biāo)準(zhǔn)證照中結(jié)構(gòu)化信息定位提取方法,其特征在于,還包括如下任意一項或任意多項:
-所述參考圖片選擇正立的、沒有明顯角度傾斜的圖片;
-所述對所述參考圖片上關(guān)鍵詞和關(guān)鍵內(nèi)容的位置進(jìn)行標(biāo)注,其中:對于所述關(guān)鍵詞,所述標(biāo)注框緊密包圍所述關(guān)鍵詞;對于所述關(guān)鍵內(nèi)容,所述標(biāo)注框框住所述關(guān)鍵內(nèi)容的所在范圍即可;
-所述輔助信息,包括:
layout,用于描述標(biāo)準(zhǔn)證照的版面格式;
location,用于描述從原始圖像中截取的有效圖片區(qū)域;
key,用于描述關(guān)鍵詞信息,并設(shè)定關(guān)鍵詞定義規(guī)則;
value,用于描述關(guān)鍵內(nèi)容信息;
anchors,用于在同一個關(guān)鍵詞key在同類材料中描述不同時,構(gòu)建表示同一個關(guān)鍵詞含義的列表,所述列表包括關(guān)鍵詞信息和關(guān)鍵詞位置信息;
index,用于在同一材料中存在多個關(guān)鍵詞key時,按照設(shè)定的排序規(guī)則,對多個關(guān)鍵詞key依次排序;
key_loc,用于描述關(guān)鍵詞key的絕對位置坐標(biāo);
val_loc,用于描述關(guān)鍵內(nèi)容value的絕對位置坐標(biāo)。
4.根據(jù)權(quán)利要求1-3中任一項所述的標(biāo)準(zhǔn)證照中結(jié)構(gòu)化信息定位提取方法,其特征在于,所述利用所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件,對所述OCR圖片中得到的文本框進(jìn)行定位,得到相應(yīng)位置上的關(guān)鍵詞以及與所述關(guān)鍵詞相對應(yīng)的關(guān)鍵內(nèi)容,包括:
利用所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件中的版面格式信息,對所述OCR圖片中的文本框進(jìn)行排序;
利用所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件中的有效圖片區(qū)域信息,獲取所述OCR圖片中文本框所在的有效文本框區(qū)域;
利用所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件中的關(guān)鍵詞信息,將所述有效文本框區(qū)域中對應(yīng)關(guān)鍵詞和關(guān)鍵內(nèi)容的文本框進(jìn)行分割;
利用所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件中的關(guān)鍵詞位置信息,在所述文本框中找到關(guān)鍵詞所在的位置,并利用所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件中的關(guān)鍵詞定義規(guī)則,排除重名的關(guān)鍵詞之間的干擾;
根據(jù)所述有效文本框區(qū)域中所有已知關(guān)鍵詞的位置,結(jié)合所述標(biāo)準(zhǔn)證照結(jié)構(gòu)化信息配置文件中的關(guān)鍵詞的絕對位置坐標(biāo)和關(guān)鍵內(nèi)容的絕對位置坐標(biāo),預(yù)測得到對應(yīng)關(guān)鍵內(nèi)容的位置,進(jìn)而得到與相應(yīng)位置上的關(guān)鍵詞相對應(yīng)的關(guān)鍵內(nèi)容。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江西思賢數(shù)據(jù)科技有限公司,未經(jīng)江西思賢數(shù)據(jù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211464435.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種API接口加密簽名方法
- 下一篇:一種污水處理用沉淀池
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





