[發(fā)明專利]適配多類OCR識別接口的表格識別方法及相關(guān)設(shè)備有效
| 申請?zhí)枺?/td> | 202110399260.0 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN112906695B | 公開(公告)日: | 2022-03-08 |
| 發(fā)明(設(shè)計(jì))人: | 曹峰;黃夫龍 | 申請(專利權(quán))人: | 數(shù)庫(上海)科技有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06V30/414;G06F40/177 |
| 代理公司: | 上海十蕙一蘭知識產(chǎn)權(quán)代理有限公司 31331 | 代理人: | 劉秋蘭 |
| 地址: | 201112 上海市閔行*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 適配多類 ocr 識別 接口 表格 方法 相關(guān) 設(shè)備 | ||
1.一種適配多類OCR識別接口的表格識別方法,其特征在于,包括:
接收提取請求,所述提取請求中包含有文檔及識別模式;
根據(jù)所述識別模式,調(diào)用預(yù)設(shè)的外部OCR接口,通過所述外部OCR接口將所述文檔進(jìn)行識別處理,接收所述外部OCR接口返回的識別數(shù)據(jù);
將所述識別數(shù)據(jù)生成表格數(shù)據(jù),返回所述表格數(shù)據(jù);
所述將所述識別數(shù)據(jù)生成表格數(shù)據(jù),返回所述表格數(shù)據(jù)前,包括:
若所述識別模式是圖片無線框表格提取模式時,接收所述外部OCR接口返回的識別數(shù)據(jù)為包含坐標(biāo)位置的文本塊信息;
通過預(yù)設(shè)的無線框表格生成算法對含坐標(biāo)位置的文本塊信息進(jìn)行后處理,生成處理后的所述識別數(shù)據(jù);
所述無線框表格生成算法,包括:
將含坐標(biāo)位置的文本塊信息經(jīng)過預(yù)設(shè)的計(jì)算規(guī)則推出待構(gòu)建表格結(jié)構(gòu);
對所述待構(gòu)建表格結(jié)構(gòu)進(jìn)行表格預(yù)處理,所述表格預(yù)處理包括去除干擾線、拼接橫線或豎線、組裝表格行和合并單元格中的至少一種或多種組合;
判斷經(jīng)表格預(yù)處理后的所述待構(gòu)建表格結(jié)構(gòu)是否完整,若完整則所述待構(gòu)建表格結(jié)構(gòu)即為所述識別數(shù)據(jù),若不完整,則對所述待構(gòu)建表格結(jié)構(gòu)補(bǔ)齊線條后構(gòu)建完整的表格,形成所述識別數(shù)據(jù);
所述對所述待構(gòu)建表格結(jié)構(gòu)補(bǔ)齊線條后構(gòu)建完整的表格,形成所述識別數(shù)據(jù),包括:
根據(jù)組裝好的單元格,合并所述單元格內(nèi)的文本塊信息;
判斷所述待構(gòu)建表格結(jié)構(gòu)的缺失類型,所述缺失類型包括缺失關(guān)鍵信息類型,所述缺失關(guān)鍵信息類型包括缺失行或列中的至少一種;
若任一文本塊缺失了關(guān)鍵信息為行信息,則遍歷已知表格的所有行,根據(jù)所述文本塊的Y坐標(biāo)以及所述文本塊的高度,與每一行所在的Y坐標(biāo)信息以及行高比較重合度,如果重合度大于預(yù)設(shè)重合度閾值,則認(rèn)為所述文本塊的行信息與當(dāng)前行相同,否則認(rèn)為所述文本塊不在表格中,找到行信息的同時如果所述文本塊在已知表格的左邊,則更新整個表格的左邊界為所述文本塊的左邊界,同樣如果所述文本塊在已知表格的右邊則更新表格的右邊界為所述文本塊的右邊界;
若任一文本塊缺失了關(guān)鍵信息為列信息,則遍歷已知表格的所有列,根據(jù)所述文本塊的X坐標(biāo)以及文本塊的寬度,與每一列所在的X坐標(biāo)信息以及列寬比較重合度,如果重合度大于預(yù)設(shè)重合度閾值,則認(rèn)為所述文本塊的列信息與當(dāng)前列相同,否則認(rèn)為所述文本塊不在表格中,找到列信息的同時如果所述文本塊在已知表格的上邊,則更新整個表格的上邊界為所述文本塊的上邊界,同樣如果所述文本塊在已知表格的下邊,則更新表格的下邊界為所述文本塊的下邊界。
2.如權(quán)利要求1所述的適配多類OCR識別接口的表格識別方法,其特征在于,所述文檔包括通用表格文檔和圖片。
3.如權(quán)利要求1所述的適配多類OCR識別接口的表格識別方法,其特征在于,所述識別模式包括通用表格提取模式、圖片正常表格提取模式和圖片無線框表格提取模式中的一種;
所述外部OCR接口包括與所述通用表格提取模式對應(yīng)的通用表格提取接口、與所述圖片正常表格提取模式對應(yīng)的表格OCR提取接口和與所述圖片無線框表格提取模式對應(yīng)的文檔OCR提取接口。
4.如權(quán)利要求1所述的適配多類OCR識別接口的表格識別方法,其特征在于,所述根據(jù)所述識別模式,調(diào)用預(yù)設(shè)的外部OCR接口之前,包括:
所述提取請求中還包括圖片處理參數(shù),接收提取請求后,根據(jù)所述圖片處理參數(shù)對所述文檔進(jìn)行預(yù)處理;
將處理好的所述文檔轉(zhuǎn)換為預(yù)設(shè)的編碼格式。
5.如權(quán)利要求4所述的適配多類OCR識別接口的表格識別方法,其特征在于,所述圖片處理參數(shù)包括框選位置信息、圖像DPI增強(qiáng)參數(shù)、旋轉(zhuǎn)角度檢測和修正、圖片邊緣噪音裁剪、去印章或補(bǔ)充畫線中的至少一種。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于數(shù)庫(上海)科技有限公司,未經(jīng)數(shù)庫(上海)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110399260.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多類標(biāo)準(zhǔn)儀器組成的集成計(jì)量檢定裝置
- 雙卡終端的適配方法和裝置
- 一種檢測急性單核細(xì)胞白血病的適配體、篩選方法與應(yīng)用
- 一種檢測急性早幼粒細(xì)胞白血病適配體的篩選方法與應(yīng)用
- 一種多虛擬化平臺的管理方法及裝置
- 一種多類型數(shù)據(jù)庫適配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 多曲率球殼體混凝土結(jié)構(gòu)定位找形系統(tǒng)
- 多租戶訪問服務(wù)實(shí)現(xiàn)方法、裝置、設(shè)備及存儲介質(zhì)
- 一種多模態(tài)服務(wù)的自適應(yīng)轉(zhuǎn)接網(wǎng)關(guān)配置系統(tǒng)
- 一種適配多型管件的造口袋
- OCR文檔識別方法及其裝置
- 智能調(diào)度多OCR識別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學(xué)系統(tǒng)的OCR識別方法、裝置和終端
- OCR識別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評估方法、裝置、設(shè)備及可讀存儲介質(zhì)
- OCR模型訓(xùn)練方法、系統(tǒng)及裝置
- 識別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- OCR訓(xùn)練數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)





