[發明專利]一種形變表格結構識別方法在審
| 申請號: | 202210573606.9 | 申請日: | 2022-05-24 |
| 公開(公告)號: | CN114973283A | 公開(公告)日: | 2022-08-30 |
| 發明(設計)人: | 鐘婧婷;楊詞慧;葉小麗 | 申請(專利權)人: | 南昌航空大學 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06V30/164;G06V30/18 |
| 代理公司: | 南昌豐擇知識產權代理事務所(普通合伙) 36137 | 代理人: | 張榮 |
| 地址: | 330000 江*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 形變 表格 結構 識別 方法 | ||
本發明公開了一種形變表格結構識別方法,其特征在于,該方法包括以下步驟:圖像預處理、字符去除、角點定位、輪廓獲取、單元格定位。本發明的優點在于:該方法對于形變表格存在的背景、光照、物理形變等干擾,提供一種形變表格結構識別方法。該方法能夠有效去除圖像中的字符,準確獲取圖像中的角點信息,同時定位單元格的位置。此方法能夠有效適用于形變表格的結構識別,不僅抗干擾能力強、準確率高,還具有較好的應用前景。
技術領域
本發明屬于計算機信息技術領域,具體涉及一種形變表格結構識別方法。
背景技術
表格結構識別是圖像處理和文檔識別領域中的重要研究內容。表格的樣式、類型多種多樣,使得表格圖像的結構識別成為一大難題。如今成熟的表格結構識別方法大多針對PDF、HTML或掃描類表格圖像,如名稱為“一種基于圖像識別的PDF表格結構識別方法”(公開號為CN111144300A)的專利文獻和名稱為“一種基于圖注意力機制的PDF表格結構識別方法”(公開號為CN110751038A)的專利文獻分別公開了針對PDF表格圖像的結構識別方法。這些方法僅針對于PDF表格圖像,適用范圍較為局限。
也有專利提出了針對拍照類表格圖像的結構識別方法,如名稱為“一種表格結構提取方法”(公開號為CN111368695A)的專利文獻公開了一種基于圖像的表格結構提取方法,通過直線檢測、查找角點、斷線續連等步驟獲取表格單元格。雖然該方法能夠完整提取表格,但當圖像的表格線彎曲時便不再適用。名稱為“一種基于表格節點識別的表格結構補全算法”(公開號為CN109447007A)的專利文獻公開了一種通過識別表格節點,盡可能還原表格本身結構化特征的方法。雖然該方法能夠對有透視角度的圖像進行矯正,但對于存在卷曲、褶皺的圖像仍然很難獲得較高的準確度。
發明內容
為解決上述技術問題,本發明提出一種形變表格結構識別方法,對存在背景、光照、物理形變等因素干擾的表格圖像進行結構識別;通過圖像預處理、字符去除、角點定位、輪廓獲取、單元格定位等方法識別表格圖像的結構。
本發明提出的一種形變表格結構識別方法,其特征在于,該方法包括以下步驟:
(1)圖像預處理;對輸入的含有表格的原始圖像I進行圖像增強、二值化及骨架提取,得到第一二值圖像I1;
(2)字符去除;采用字符去除算法將第一二值圖像I1中存在的大部分字符去除,得到第二二值圖像I2;然后進一步判斷像素點四個鄰接矩形區域中黑色像素點的個數,將第二二值圖像I2中的所有字符去除,得到第三二值圖像I3;
(3)角點定位;首先采用角點檢測算法對第三二值圖像I3中的角點進行檢測,得到第一角點集合P1;然后對第一角點集合P1中的角點進行聚類,得到第二角點集合P2;最后對第二角點集合P2中不符合條件的角點進行篩選,得到原始圖像I的角點集合P3;
(4)輪廓獲?。粚⒌谌祱D像I3水平方向上寬度為1的像素刪除,獲取只保留水平線的第四二值圖像I4;獲取第四二值圖像I4中所有的輪廓Con1,Con2,...,Conβ,其中β為第四二值圖像I4中的輪廓總數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南昌航空大學,未經南昌航空大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210573606.9/2.html,轉載請聲明來源鉆瓜專利網。





