[發明專利]表格結構識別方法、裝置、設備及存儲介質在審
| 申請號: | 202210445852.6 | 申請日: | 2022-04-26 |
| 公開(公告)號: | CN114743202A | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 陳海波;李閣 | 申請(專利權)人: | 深延科技(北京)有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V30/412;G06V30/414;G06K9/62;G06V10/26;G06F40/18;G06V20/70;G06V10/774 |
| 代理公司: | 上海和華啟核知識產權代理有限公司 31339 | 代理人: | 余昌昊 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表格 結構 識別 方法 裝置 設備 存儲 介質 | ||
本發明提供一種表格結構識別方法、裝置、設備及存儲介質,屬于圖像識別技術領域。表格結構識別方法,包括:獲取目標圖像,目標圖像為包括表格結構的圖像;將目標圖像輸入到語義分割模型,輸出目標圖像中的表格分隔線,表格分隔線包括橫分隔線和豎分隔線,語義分割模型具備識別目標圖像中的有線表格分隔線和無線表格分隔線的能力;根據表格分隔線確定表格結構的單元格;匹配單元格和表格結構中各單元格的文本,以確定表格結構。以對無線表格和有線表格都能夠進行良好的識別。
技術領域
本發明涉及圖像識別技術領域,具體而言,涉及一種表格結構識別方法、裝置、設備及存儲介質。
背景技術
在人們進行無紙化辦公的過程中,為了具有更高的傳播性,避免其他電腦無法打開或打開后文檔排版不一致。電腦中很多文檔都是PDF、圖片等格式。
從而,當用戶需要將PDF或圖片格式的文檔中的表格結構復制出來,則需要通過圖像識別技術先對文檔中的表格結構進行識別。
當時,目前的表格結構識別方式中,一般采用圖像處理的方式來識別圖像中的表格分隔線,從而識別出表格結構,但是這種方式對于表格分割線為無線的表格結構(即無線表格),則無法進行識別。
發明內容
本發明的目的在于提供一種表格結構識別方法、裝置、設備及存儲介質,以對無線表格和有線表格都能夠進行良好的識別。
本發明的實施例是這樣實現的:
本發明實施例的第一方面,提供一種表格結構識別方法,包括:獲取目標圖像,目標圖像為包括表格結構的圖像;將目標圖像輸入到語義分割模型,輸出目標圖像中的表格分隔線,表格分隔線包括橫分隔線和豎分隔線,語義分割模型具備識別目標圖像中的有線表格分隔線和無線表格分隔線的能力;根據表格分隔線確定表格結構的單元格;匹配單元格和表格結構中各單元格的文本,以確定表格結構。
通過該方法,無論表格結構中的表格分隔線為有線還是無線,均能夠利用語義分割模型來進行識別,從而便能夠根據識別出的表格分隔線來確定出表格結構中的各單元格。進而匹配出表格結構。如此,能夠簡單有效的對無線表格和有線表格或者部分有線部分無線的表格結構進行識別。
可選地,根據表格分隔線確定表格結構的單元格,包括:確定各表格分隔線間的交點;按列從左到右、按列從右到左、按行從上到下以及按行從下到上中的至少兩個方向遍歷交點;若存在四個交點,四個交點中任意相鄰的兩個交點均處于同一表格分隔線中,則確定四個交點圍成一個單元格。
可選地,獲取目標圖像,包括:確定待識別圖像中的表格結構的位置信息;根據位置信息裁剪待識別圖像,以得到目標圖像。
可選地,在獲取目標圖像之前,方法還包括:識別待識別圖像中的文本;根據文本的方向,調整待識別圖像以使文本的方向調整為可讀方向。
可選地,語義分割模型采用數據集訓練,數據集包括多個包含表格結構的圖像,且各圖像中對表格結構的表格分隔線進行了標注。
本發明實施例的第二方面,提供一種表格結構識別裝置,其特征在于,包括:獲取模塊,用于獲取目標圖像,目標圖像為包括表格結構的圖像;處理模塊,用于將目標圖像輸入到語義分割模型,輸出目標圖像中的表格分隔線,表格分隔線包括橫分隔線和豎分隔線,語義分割模型具備識別目標圖像中的有線表格分隔線和無線表格分隔線的能力;根據表格分隔線確定表格結構的單元格;匹配單元格和表格結構中各單元格的文本,以確定表格結構。
可選地,處理模塊,具體用于確定各表格分隔線間的交點;按列從左到右、按列從右到左、按行從上到下以及按行從下到上中的至少兩個方向遍歷交點;若存在四個交點,四個交點中任意相鄰的兩個交點均處于同一表格分隔線中,則確定四個交點圍成一個單元格。
可選地,獲取模塊,具體用于確定待識別圖像中的表格結構的位置信息;根據位置信息裁剪待識別圖像,以得到目標圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深延科技(北京)有限公司,未經深延科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210445852.6/2.html,轉載請聲明來源鉆瓜專利網。





