[發(fā)明專利]表格重建方法、裝置、計算機設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011184112.9 | 申請日: | 2020-10-28 |
| 公開(公告)號: | CN112200822A | 公開(公告)日: | 2021-01-08 |
| 發(fā)明(設(shè)計)人: | 盛森;姜福泉;楊智林;魏汝蘭;梁哲恒;吉緒發(fā);章小明;宋軍;成曉攀;蔡胤 | 申請(專利權(quán))人: | 廣東南方數(shù)碼科技股份有限公司 |
| 主分類號: | G06T7/13 | 分類號: | G06T7/13;G06T7/12;G06T3/60;G06T11/20 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 李莎 |
| 地址: | 510000 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 表格 重建 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
本申請?zhí)峁┮环N表格重建方法、裝置、計算機設(shè)備及存儲介質(zhì),涉及圖像處理技術(shù)領(lǐng)域。該方法包括:對表格圖像進(jìn)行輪廓檢測;根據(jù)表格圖像的輪廓檢測結(jié)果,確定表格圖像中表格區(qū)域的區(qū)域輪廓;根據(jù)區(qū)域輪廓對表格圖像進(jìn)行正射矯正,得到正射矯正后的表格圖像;對正射矯正后的表格圖像進(jìn)行輪廓檢測,得到表格圖像中表格區(qū)域的多個目標(biāo)輪廓;根據(jù)多個目標(biāo)輪廓進(jìn)行表格重建。本申請實施例可提高重建的表格與原表格的格式的匹配度,提高了表格重建的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體而言,涉及一種表格重建方法、裝置、計算機設(shè)備及存儲介質(zhì)。
背景技術(shù)
對表格圖像中的表格進(jìn)行識別并提取是互聯(lián)網(wǎng)時代非常重要的一項技術(shù)。在一些專業(yè)的OCR(Optical Character Recognition,光學(xué)字符識別)軟件,例如ABByy finereader中,提供付費的表格識別提取技術(shù),但這些技術(shù)并未被公開使用。
現(xiàn)有的對表格圖像中的表格進(jìn)行重建,普遍采用機器視覺算法,對表格圖像中的線段進(jìn)行提取,基于提取到的線段進(jìn)行表格重建。
但是,采用機器視覺算法進(jìn)行表格圖像中的表格重建,重建的表格與表格圖像中的原表格的一致性較差,不利于對較為復(fù)雜的表格圖像進(jìn)行表格重建。
發(fā)明內(nèi)容
本發(fā)明的目的在于,針對上述現(xiàn)有技術(shù)中的不足,提供一種表格重建方法、裝置、計算機設(shè)備及存儲介質(zhì),以便使重建的表格與表格圖像中的原表格的格式保持一致。
為實現(xiàn)上述目的,本申請實施例采用的技術(shù)方案如下:
第一方面,本申請實施例提供了一種表格重建方法,包括:
對表格圖像進(jìn)行輪廓檢測;
根據(jù)所述表格圖像的輪廓檢測結(jié)果,確定所述表格圖像中表格區(qū)域的區(qū)域輪廓;
根據(jù)所述區(qū)域輪廓對所述表格圖像進(jìn)行正射矯正,得到正射矯正后的表格圖像;
對所述正射矯正后的表格圖像進(jìn)行輪廓檢測,得到所述表格區(qū)域中的多個目標(biāo)輪廓;
根據(jù)所述多個目標(biāo)輪廓進(jìn)行表格重建。
可選的,所述輪廓檢測結(jié)果包括:所述表格圖像中的多個初始輪廓,以及每個初始輪廓的層級結(jié)構(gòu),所述每個初始輪廓的層級結(jié)構(gòu)用于表征所述每個初始輪廓在所述表格圖像中的層級位置;
所述根據(jù)所述表格圖像的輪廓檢測結(jié)果,確定所述表格圖像中表格區(qū)域的區(qū)域輪廓,包括:
根據(jù)所述多個每個初始輪廓的層級結(jié)構(gòu),從所述多個初始輪廓中確定最外層的輪廓為所述表格圖像中表格區(qū)域的區(qū)域輪廓。
可選的,所述根據(jù)所述區(qū)域輪廓對所述表格圖像進(jìn)行正射矯正,得到正射矯正后的表格圖像,包括:
對所述區(qū)域輪廓進(jìn)行多邊形近似,得到初始多邊形的頂點坐標(biāo);
根據(jù)所述初始多邊形的頂點坐標(biāo),求取所述初始多邊形的外接矩形,得到所述外接矩形的頂點坐標(biāo);
根據(jù)所述初始多邊形的頂點坐標(biāo)和所述外接矩形的頂點坐標(biāo),計算單應(yīng)矩陣;
根據(jù)所述單應(yīng)矩陣,對所述表格圖像進(jìn)行正射矯正,得到正射矯正后的表格圖像。
可選的,所述對表格圖像進(jìn)行輪廓檢測,得到所述表格圖像中的多個初始輪廓,以及每個初始輪廓的層級結(jié)構(gòu),包括:
對所述表格圖像進(jìn)行灰度處理,得到灰度表格圖像;
對所述灰度表格圖像進(jìn)行二值化處理,得到二值化表格圖像;
對所述二值化表格圖像進(jìn)行輪廓檢測,得到所述表格圖像中的多個初始輪廓,以及所述層級結(jié)構(gòu)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東南方數(shù)碼科技股份有限公司,未經(jīng)廣東南方數(shù)碼科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011184112.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





