[發明專利]表格檢測方法、裝置、設備和存儲介質有效
| 申請號: | 202010137085.3 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN113343740B | 公開(公告)日: | 2022-05-06 |
| 發明(設計)人: | 楊志博;龍如蛟;高飛宇;羅未萌;王永攀 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412 |
| 代理公司: | 北京太合九思知識產權代理有限公司 11610 | 代理人: | 孫明子;劉戈 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表格 檢測 方法 裝置 設備 存儲 介質 | ||
本發明實施例提供一種表格檢測方法、裝置、設備和存儲介質,該方法包括:獲取表格圖像;將表格圖像輸入到表格檢測模型中,以通過表格檢測模型獲取表格圖像對應的多種單元格信息和多個線交叉點信息;根據多種單元格信息確定表格圖像中包含的多個單元格區域;根據多個線交叉點信息對多個單元格區域進行邊界校正,以獲得邊界校正后的多個單元格區域。在該方案中,結合包含單元格信息和線交叉點信息的多種維度信息,可以實現表格圖像中單元格邊界的準確檢測。
技術領域
本發明涉及圖像處理技術領域,尤其涉及一種表格檢測方法、裝置、設備和存儲介質。
背景技術
隨著辦公自動化和光學字符識別(Optical Character Recognition,簡稱OCR)技術的普及,將諸如工作等場景中存在的表格圖像中包含的文字信息轉換為以文檔、Excel等格式輸出的需求應運而生,基于這種轉換處理,可以方便相關人員對表格圖像中包含的文字信息進行存儲、計算處理。表格圖像例如為增值稅發票、銀行流水單、飛機行程單等。
為了實現上述轉換目的,除了需要通過OCR技術識別表格圖像中包含的文字外,還需要能夠準確地檢測出表格圖像中包含的各個單元格的邊界。因為需要基于單元格之間的鄰接關系確定不同單元格內的文字之間的語義相關性,以理解不同單元格內的文字的物理含義。
基于此,準確地檢測出表格圖像中包含的各個單元格的邊界是首先要解決的問題。
發明內容
本發明實施例提供一種表格檢測方法、裝置、設備和存儲介質,能夠準確地檢測出表格圖像中包含的各單元格的邊框。
第一方面,本發明實施例提供一種表格檢測方法,該方法包括:
獲取表格圖像;
將所述表格圖像輸入到表格檢測模型中,以通過所述表格檢測模型獲取所述表格圖像對應的多種單元格信息和多個線交叉點信息;
根據所述多種單元格信息確定所述表格圖像中包含的多個單元格區域;
根據所述多個線交叉點信息對所述多個單元格區域進行邊界校正,以獲得邊界校正后的多個單元格區域。
第二方面,本發明實施例提供一種表格檢測裝置,該裝置包括:
獲取模塊,用于獲取表格圖像;
確定模塊,用于將所述表格圖像輸入到表格檢測模型中,以通過所述表格檢測模型獲取所述表格圖像對應的多種單元格信息和多個線交叉點信息;根據所述多種單元格信息確定所述表格圖像中包含的多個單元格區域;根據所述多個線交叉點信息對所述多個單元格區域進行邊界校正,以獲得邊界校正后的多個單元格區域。
第三方面,本發明實施例提供一種電子設備,包括:存儲器、處理器;其中,存儲器上存儲有可執行代碼,當所述可執行代碼被處理器執行時,使處理器至少可以實現如第一方面所述的表格檢測方法。
本發明實施例提供了一種非暫時性機器可讀存儲介質,非暫時性機器可讀存儲介質上存儲有可執行代碼,當所述可執行代碼被電子設備的處理器執行時,使處理器至少可以實現如第一方面所述的表格檢測方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010137085.3/2.html,轉載請聲明來源鉆瓜專利網。





