[發明專利]表格解析方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202210339121.3 | 申請日: | 2022-04-01 |
| 公開(公告)號: | CN114677695A | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 張鵬;齊蓉;葉瑛鋒;韋昌勇 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06V30/414;G06V30/418 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 蔡抒楓 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表格 解析 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種表格解析方法,其特征在于,所述方法包括:
識別待處理影像中的文本,以及所述文本在所述待處理影像中的位置;所述待處理影像中包含待解析表格;
根據所述文本和所述位置,確定所述待解析表格的表頭信息和跨度信息;
根據所述表頭信息和所述跨度信息,從所述待處理影像中確定出目標區域;所述目標區域為所述待處理影像中包含所述待解析表格的最小區域;
從所述目標區域中識別出目標文本;所述目標文本為屬于同一個單元格的文本;
將所述目標文本與所述表頭信息進行匹配,得到所述待處理影像中所述待解析表格的表格解析結果。
2.根據權利要求1所述的方法,其特征在于,所述根據所述文本和所述位置,確定所述待解析表格的表頭信息和跨度信息,包括:
獲取待解析表格的表頭關鍵字;
通過在所述文本中查找所述表頭關鍵字,得到所述待解析表格的表頭;
確定所述表頭的表頭信息;所述表頭信息包括表頭頂點;
根據所述表頭頂點,得到所述待解析表格的跨度信息。
3.根據權利要求2所述的方法,其特征在于,所述表頭信息還包括表頭位置;所述根據所述表頭信息和所述跨度信息,從所述待處理影像中確定出目標區域,包括:
通過在所述表頭上方查找距離所述表頭位置最近,且長度不小于所述跨度信息的橫線,得到所述待解析表格的上框線;
通過在所述表頭下方查找距離所述表頭位置最遠,且長度不小于所述跨度信息的橫線,得到所述待解析表格的下框線;
根據所述上框線和所述下框線,從所述待處理影像中確定出所述目標區域。
4.根據權利要求1所述的方法,其特征在于,所述從所述目標區域中識別出目標文本,包括:
獲取所述目標區域中至少兩個文本的空間特征;
判斷所述至少兩個文本的空間特征是否符合預設條件;
若符合,判斷所述至少兩個文本的內容是否連續;
若連續,則判定所述至少兩個文本為所述目標文本。
5.根據權利要求4所述的方法,其特征在于,所述空間特征包括水平間距和垂直間距;所述判斷所述至少兩個文本的空間特征是否符合預設條件,包括:
判斷所述至少兩個文本的水平間距是否不超過預設的第一間距,和/或,判斷所述至少兩個文本的垂直間距是否不超過預設的第二間距。
6.根據權利要求2所述的方法,其特征在于,所述將所述目標文本與所述表頭信息進行匹配,得到所述待處理影像中所述待解析表格的表格解析結果,包括:
當所述目標文本與至少兩個所述表頭相匹配時,分別獲取所述目標文本與至少兩個所述表頭之間的距離;
通過在各所述距離中查找最小值,得到最小距離;
根據所述最小距離對應的表頭,得到與所述目標文本相匹配的目標表頭;
根據所述目標文本和所述目標表頭,得到所述待解析表格的表格解析結果。
7.一種表格解析裝置,其特征在于,所述裝置包括:
影像文本識別模塊,用于識別待處理影像中的文本,以及所述文本在所述待處理影像中的位置;所述待處理影像中包含待解析表格;
表格參數確定模塊,用于根據所述文本和所述位置,確定所述待解析表格的表頭信息和跨度信息;
表格區域確定模塊,用于根據所述表頭信息和所述跨度信息,從所述待處理影像中確定出目標區域;所述目標區域為所述待處理影像中包含所述待解析表格的最小區域;
表格文本識別模塊,用于從所述目標區域中識別出目標文本;所述目標文本為屬于同一個單元格的文本;
表格解析模塊,用于將所述目標文本與所述表頭信息進行匹配,得到所述待處理影像中所述待解析表格的表格解析結果。
8.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至6中任一項所述的方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210339121.3/1.html,轉載請聲明來源鉆瓜專利網。





