[發明專利]基于語義分割的表格重建方法、裝置、設備及存儲介質在審
| 申請號: | 202110433642.0 | 申請日: | 2021-04-21 |
| 公開(公告)號: | CN113052181A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 朱錦祥;臧磊 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06F40/166 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 分割 表格 重建 方法 裝置 設備 存儲 介質 | ||
本申請涉及人工智能領域,具體公開了一種基于語義分割的表格重建方法、裝置、設備及存儲介質。該方法包括:獲取待重建圖像,所述待重建圖像中存在待重建表格;對所述待重建圖像進行語義分割,得到多個掩碼圖,其中,所述多個掩碼圖與多個預設分割類別一一對應,所述多個掩碼圖中的每個掩碼圖用于表示所述待重建圖像中的各個像素點屬于與所述每個掩碼圖對應的預設分割類別的概率;根據所述多個掩碼圖構建待重建表格;從所述待重建圖像中提取與所述待重建表格對應的文字內容;將所述文字內容填入所述待重建表格,得到重建好的表格。本申請實施例有利于提高表格重建的精度。
技術領域
本申請涉及人工智能技術領域,具體涉及一種基于語義分割的表格重建方法、裝置、設備及存儲介質。
背景技術
表格作為一種有效的數據組織與展現方法被廣泛應用,也成為各類文檔中常見的頁面對象。表格通常以結構化的方式展示基本信息,因而表格檢測和識別是諸多文件分析應用中的一項重要任務。而且,隨著文檔數目的爆炸性增長,如何高效地從文檔中找到表格并獲取內容與結構信息即表格識別,成為了一個亟待解決的問題。
目前,對于圖像中的表格的檢測與重建大多通過邊緣檢測的方式來實現,即通過邊緣檢測技術識別出表格的邊界,基于表格的邊界重建表格。但是,實際應用中有些圖像可能會存在變形,甚至有些表格沒有明顯的邊界,這都給邊緣檢測帶來巨大的挑戰,導致重建出的表格精度低。
發明內容
本申請實施例提供了一種基于語義分割的表格重建方法、裝置、設備及存儲介質。通過語義分割的方式,提高表格的重建精度。
第一方面,本申請實施例提供一種基于語義分割的表格重建方法,包括:
獲取待重建圖像,所述待重建圖像中存在待重建表格;
對所述待重建圖像進行語義分割,得到多個掩碼圖,其中,所述多個掩碼圖與多個預設分割類別一一對應,所述多個掩碼圖中的每個掩碼圖用于表示所述待重建圖像中的各個像素點屬于與所述每個掩碼圖對應的預設分割類別的概率;
根據所述多個掩碼圖構建待重建表格;
從所述待重建圖像中提取與所述待重建表格對應的文字內容;
將所述文字內容填入所述待重建表格,得到重建好的表格。
第二方面,本申請實施例提供一種表格重建裝置,包括:
獲取單元,用于獲取待重建圖像,所述待重建圖像中存在待重建表格;
處理單元,用于對所述待重建圖像進行語義分割,得到多個掩碼圖,其中,所述多個掩碼圖與多個預設分割類別一一對應,所述多個掩碼圖中的每個掩碼圖用于表示所述待重建圖像中的各個像素點屬于與所述每個掩碼圖對應的預設分割類別的概率;
根據所述多個掩碼圖構建待重建表格;
從所述待重建圖像中提取與所述待重建表格對應的文字內容;
將所述文字內容填入所述待重建表格,得到重建好的表格。
第三方面,本申請實施例提供一種電子設備,包括:處理器,所述處理器與存儲器相連,所述存儲器用于存儲計算機程序,所述處理器用于執行所述存儲器中存儲的計算機程序,以使得所述電子設備執行如第一方面所述的方法。
第四方面,本申請實施例提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序使得計算機執行如第一方面所述的方法。
第五方面,本申請實施例提供一種計算機程序產品,所述計算機程序產品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質,所述計算機可操作來使計算機執行如第一方面所述的方法。
實施本申請實施例,具有如下有益效果:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110433642.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種大件物流件裝載設備
- 下一篇:一種體檢中心護理用試管放置架





