[發明專利]表格圖片的處理方法、系統、可讀存儲介質及計算機設備有效
| 申請號: | 202011037842.6 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN111881659B | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 甘宇;張雷;王君;夏志超;李振剛;劉斯凡;袁海光 | 申請(專利權)人: | 江西漢辰信息技術股份有限公司;深圳京發科技控股有限公司 |
| 主分類號: | G06F40/174 | 分類號: | G06F40/174 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 彭琰 |
| 地址: | 330000 江西省南昌市南昌高新技術產業開發區*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表格 圖片 處理 方法 系統 可讀 存儲 介質 計算機 設備 | ||
本發明公開了一種表格圖片的處理方法、系統、可讀存儲介質及計算機設備,所述方法包括:根據原始表格圖片獲取每個單元格的位置信息,所述位置信息包括所述單元格的四個頂點位置;判斷當前單元格的任一非頂點位置與相鄰單元格的任一頂點位置是否重合;若是,則判定所述當前單元格為合并單元格,在當前單元格的相鄰位置插入單元格;通過獲取每個單元格的四個頂點位置作為位置信息,并根據所述位置信息為參考插入新的單元格;通過本發明的方案,不需要生成表格點,從而避免了表格點因參數設置缺失,處理表格點時可能導致無法插入單元格的問題。
技術領域
本發明涉及數據處理技術領域,特別是涉及表格圖片的處理方法、系統、可讀存儲介質及計算機設備。
背景技術
日常工作中,經常需要將含有表格的文件電子化,以對表格內容進行操作、編輯,比如紙質財務報表的電子化處理,通常使用終端設備對財務報表進行拍照,或通過掃描設備對紙質財務報表進行掃描,利用圖像識別技術將文件電子化。而現有的含表格圖片電子化后,其表格內容依舊是不可編輯的,還需將其轉化為可編輯的表格格式(如Excel格式),首先將表格圖片按合并單元格分割成合并單元格圖片,使用圖片文字識別技術識別其中的文字內容,再還原各合并單元格至表格中的初始位置,最后寫入合并單元格對應的文字內容,完成不可編輯的表格圖片內容轉為可編輯的表格內容。
常見表格分割及還原方法為:首先生成表格點,單元格頂點位置附近可能存在多個表格點,對位置附近的表格點歸一,只保留一個表格點,然后通過表格點之間的相對位置,對單元格進行分割并保存各單元格的相對位置,再通過單元格的相對位置信息對其還原。此方法存在以下問題:一是表格線可能扭曲或傾斜或行之間間隙過小,計算表格點相對位置時容易出錯,導致無法分割;二是生成表格點時因參數設置原因(圖片質量千差萬別,很難用某固定參數適用所有情況),導致某些單元格位置上表格點缺失;而出現合并單元格時,其也表現出表格點缺失的現象,因此無法判斷表格點缺失是因參數設置導致還是存在合并單元格導致。基于以上缺陷,該方法只能適用于表格線較平直且無合并單元格情況。
發明內容
本發明的目的在于提出一種表格圖片的處理方法,以解決現有的表格分割方法只適用于表格線較平直且無合并單元格的情況。
一種表格圖片的處理方法,其特征在于,所述方法包括:
根據原始表格圖片獲取每個單元格的位置信息,所述位置信息包括所述單元格的四個頂點位置;
判斷當前單元格的任一非頂點位置與相鄰單元格的任一頂點位置是否重合;
若是,則判定所述當前單元格為合并單元格,在當前單元格的相鄰位置插入單元格。
根據本發明提出的表格圖片的處理方法,通過獲取每個單元格的四個頂點位置作為單元格的位置信息,對相鄰的單元格位置信息判斷是否為合并單元格,并對所有的合并單元格的相鄰位置插入新的單元格進行分割;通過本發明的方案,不需要生成表格點,從而避免了表格點因參數設置缺失,處理表格點時可能導致無法分割單元格的問題。
另外,根據本發明提供的表格圖片的處理方法,還可以具有如下附加的技術特征:
進一步地,
所述獲取每個單元格的位置信息的具體步驟包括:
將所述原始表格圖片二值化去噪處理;
通過膨脹和腐蝕方法識別表格線,獲取只含表格線信息的處理圖片;
獲取所述處理圖片中的每個單元格的封閉輪廓的所述四個頂點位置;
根據所述單元格所述四個頂點位置去除不符合單元格長度或寬度的輪廓。
進一步地,所述判斷當前單元格的任一非頂點位置與相鄰單元格的任一頂點位置是否重合的步驟具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西漢辰信息技術股份有限公司;深圳京發科技控股有限公司,未經江西漢辰信息技術股份有限公司;深圳京發科技控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011037842.6/2.html,轉載請聲明來源鉆瓜專利網。





