[發明專利]一種圖片中表格的識別方法及裝置有效
| 申請號: | 201910249573.0 | 申請日: | 2019-03-29 |
| 公開(公告)號: | CN109993112B | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 徐青松;李青 | 申請(專利權)人: | 杭州睿琪軟件有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/68 |
| 代理公司: | 上海思捷知識產權代理有限公司 31295 | 代理人: | 王宏婧 |
| 地址: | 310053 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖片 表格 識別 方法 裝置 | ||
1.一種圖片中表格的識別方法,其特征在于,所述方法包括:
獲取待識別的圖片;
采用預先訓練的表格區域識別模型,識別出所述圖片中的表格區域;
采用預先訓練的表格單元格識別模型,識別出所述表格區域中單元格的線條;
采用預先訓練的表格文字區域識別模型,識別出所述表格區域中的文字區域;
將識別出的表格單元格的線條和識別出的全部文字區域相結合,確定所述表格區域的單元格,并對所述表格區域的單元格進行重制;
將所述表格區域中每個單元格區域進行切分,采用預先訓練的字符識別模型,識別出每個單元格區域中的字符內容;
將識別出的字符內容填入到重制后的單元格中,形成識別后的表格;
其中,所述將識別出的表格單元格的線條和識別出的全部文字區域相結合,確定所述表格區域的單元格,包括:
根據識別出的文字區域的行高、行距以及字距,調整錯誤識別的文字區域;
根據調整后的文字區域,補全所述表格區域模型未識別出的單元格的線條;
根據單元格的線條,調整所述表格區域中行和列對應的單元格。
2.如權利要求1所述的圖片中表格的識別方法,其特征在于,在將所述表格區域中每個單元格區域進行切分之后,還包括:記錄每個單元格區域的位置信息;
所述將識別出的字符內容填入到重制后的單元格中,包括:
將識別出的字符內容根據對應的單元格區域的位置信息填入到重制后的單元格中。
3.如權利要求1所述的圖片中表格的識別方法,其特征在于,所述方法還包括:
對識別出的字符內容中的文字、數字、字母和符號進行分類,根據分類結果對識別出的字符內容進行修正處理。
4.如權利要求1所述的圖片中表格的識別方法,其特征在于,所述方法還包括:
根據識別出來的字符內容在標準數據庫中進行檢索,判斷檢索結果與識別出的字符內容是否一致,如果不一致,則根據檢索結果對識別出的字符內容進行修正處理。
5.如權利要求1所述的圖片中表格的識別方法,其特征在于,所述圖片中包括:表格名稱;
所述方法還包括:
采用所述表格區域識別模型,識別出所述圖片中的表格名稱區域,并采用所述字符識別模型進行字符識別,將識別出的表格名稱與識別后的表格結合得到完整的表格信息。
6.如權利要求1所述的圖片中表格的識別方法,其特征在于,所述表格區域識別模型、所述表格單元格識別模型、所述表格文字區域識別模型是基于深度卷積神經網絡或深度殘差網絡建立的模型。
7.如權利要求1所述的圖片中表格的識別方法,其特征在于,所述字符識別模型是基于空洞卷積和注意力模型建立的模型。
8.如權利要求7所述的圖片中表格的識別方法,其特征在于,所述字符識別模型包括:針對打印字體的識別模型和針對手寫字體的識別模型,所述針對打印字體的識別模型和所述針對手寫字體的識別模型分別經過各自獨立的訓練而成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州睿琪軟件有限公司,未經杭州睿琪軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910249573.0/1.html,轉載請聲明來源鉆瓜專利網。





