[發明專利]表格結構化方法、表格恢復設備及具有存儲功能的裝置在審
| 申請號: | 202011615053.6 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112733855A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 劉馳;李立夫;謝名亮;殷兵;張銀田 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/32;G06K9/46;G06T7/13;G06T7/187 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 李申 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表格 結構 方法 恢復 設備 具有 存儲 功能 裝置 | ||
1.一種表格結構化方法,其特征在于,所述表格結構化方法包括:
獲取到待結構化圖像,提取所述待結構化圖像中的文字的位置信息以及所述待結構化圖像的多個單元格的位置信息;
對多個所述單元格進行連通域計算,得到所述待結構化圖像的表格的邊框輪廓;
獲取到所述邊框輪廓對應的包圍框的頂點的位置信息;以及
獲取到所述邊框輪廓的頂點的位置信息;
利用所述邊框輪廓的頂點的位置信息及其對應的所述包圍框的頂點的位置信息,計算得到所述邊框輪廓的變換矩陣;
通過所述變換矩陣對邊框輪廓的單元格的位置信息進行校正;
基于校正后的每個單元格的線條之間的位置關系對所述線條進行網格劃分,得到網格線條;
將所述網格線條與所述單元格進行映射,得到所述表格的結構化圖像;
利用所述文字的位置信息確定所述文字對應所述結構化圖像的位置,以得到所述待結構化圖像的表格的結構化信息。
2.根據權利要求1所述的表格結構化方法,其特征在于,所述待結構化圖像為至少一個;
獲取到所述邊框輪廓對應的包圍框的頂點的位置信息;以及獲取到所述邊框輪廓的頂點的位置信息的步驟包括:
獲取到各所述邊框輪廓對應的包圍框的頂點的位置信息;以及獲取到各所述邊框輪廓的頂點的位置信息;
所述利用所述邊框輪廓的頂點的位置信息及其對應的所述包圍框的頂點的位置信息,計算得到所述邊框輪廓的變換矩陣的步驟,包括:
利用所述邊框輪廓的頂點的位置信息及其對應的所述包圍框的頂點的位置信息,計算得到各所述邊框輪廓的變換矩陣;
所述通過所述變換矩陣對邊框輪廓的單元格的位置信息進行校正的步驟包括:
通過所述變換矩陣對各邊框輪廓的單元格的位置信息進行校正;
利用校正后的單元格的位置信息以及所述邊框輪廓的位置關系確定每個所述單元格所屬的表格。
3.根據權利要求1或2任一項所述的表格結構化方法,其特征在于,所述獲取到所述邊框輪廓對應的包圍框的頂點的位置信息的步驟,包括:
將所述表格邊框的最小外接邊框進行旋轉,得到所述最小外接邊框旋轉后的所述邊框輪廓對應的包圍框,并獲取邊框輪廓對應的包圍框的頂點的位置信息。
4.根據權利要求3所述的表格結構化方法,其特征在于,所述將所述表格邊框的最小外接邊框進行旋轉,得到所述最小外接邊框旋轉后的所述邊框輪廓對應的包圍框,并獲取所述邊框輪廓對應的包圍框的頂點的位置信息的步驟,包括:
將所述表格邊框的最小外接斜矩形進行旋轉,得到矩形的包圍框,并獲取所述矩形的包圍框的頂點的位置信息。
5.根據權利要求3所述的表格結構化方法,其特征在于,所述利用校正后的單元格的位置信息以及所述邊框輪廓的位置關系確定每個所述單元格所屬的表格的步驟,包括:
利用所述校正后的單元格的位置信息以及所述邊框輪廓的位置關系計算所述校正后的單元格與所述邊框輪廓的重疊部分的面積的比值;
判斷所述比值是否大于第一預設值,若大于所述第一預設值則確定所述單元格屬于所述表格;若否,則所述單元格不屬于所述表格。
6.根據權利要求1所述的表格結構化方法,其特征在于,所述獲取到所述邊框輪廓的對應的包圍框的頂點的位置信息以及獲取到所述邊框輪廓的頂點的位置信息的步驟具體包括:
通過多邊形擬合的方式和直線檢測的方式分別獲取對應所述邊框輪廓的頂點的位置信息。
7.根據權利要求5所述的表格結構化方法,其特征在于,所述獲取到所述邊框輪廓對應的包圍框的頂點的位置信息之后的步驟:
將所述多邊形擬合的方式和直線檢測的方式分別獲取對應所述邊框輪廓的頂點的位置信息分別映射到所述邊框輪廓對應的包圍框的頂點的位置信息上,并計算出對應的變換矩陣;
根據所述對應的變換矩陣對所述表格邊框的輪廓點進行透視變換得到所述表格邊框的輪廓點對應的外接邊框;
計算所述表格邊框的輪廓點對應的外接邊框的傾斜角平均值;
根據所述傾斜角平均值選擇多邊形擬合的方式或直線檢測的方式以獲取所述邊框輪廓的頂點的位置信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011615053.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種降水預測方法以及裝置
- 下一篇:一種利用旋轉清除積水的水冷空調扇





