[發明專利]一種處理表格圖片中框選文字的方法及裝置在審
| 申請號: | 201811317237.7 | 申請日: | 2018-11-03 |
| 公開(公告)號: | CN109447015A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 李鵬輝;竺晨曦;邱錫鵬 | 申請(專利權)人: | 上海犀語科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200082 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 位置坐標 文字內容 圖片 還原 干擾識別 訓練模型 框選 去除 預處理模塊 還原模塊 中文字 準確率 聯合 | ||
本發明提供一種處理表格圖片中框選文字的方法,包括:去除表格圖片中的干擾識別項;利用聯合訓練模型,在表格圖片中圈選出字條,獲取字條在表格圖片中的字條位置坐標、并識別出與字條相對應的文字內容;利用表格特性對字條、字條位置坐標與文字內容進行表格還原。實施上述方法的裝置,包括:用于去除表格圖片中干擾識別項的預處理模塊;利用聯合訓練模型,在表格圖片中圈選出字條,獲取字條在表格圖片中的字條位置坐標、并識別出與字條相對應的文字內容的識別模塊;利用表格特性對字條、字條位置坐標與文字內容進行表格還原的表格還原模塊。本發明可以提升表格圖片中文字識別和還原準確率。
技術領域
本發明涉及一種表格處理方法,尤其是一種處理表格圖片中框選文字的方法及裝置。
背景技術
在OCR識別領域中,對于類似A4紙的大段文字識別的準確率較高。但針對于表格的識別,目前業界準確率都不是很高。因為原有的切字識別的方式會造成難以進行版面還原,且無法利用表格中的信息。
發明內容
針對上述問題中存在的不足之處,本發明提供一種可以提升表格圖片中文字識別和還原準確率的一種處理表格圖片中框選文字的方法及裝置。
為實現上述目的,本發明提供一種處理表格圖片中框選文字的方法,包括以下步驟:
步驟1、以去除表格圖片中的干擾識別項;
步驟2、利用聯合訓練模型,在表格圖片中圈選出字條,獲取字條在表格圖片中的字條位置坐標、并識別出與字條相對應的文字內容;
步驟3、利用表格特性對字條、字條位置坐標與文字內容進行表格還原。
上述的一種處理表格圖片中框選文字的方法,其中,在步驟1中,對表格圖片進行預處理,以去除表格圖片中的干擾識別項,對表格圖片進行的預處理包括圖片角度糾偏操作、或水印印章去除操作。
上述的一種處理表格圖片中框選文字的方法,其中,在步驟2中,包括以下子步驟:
步驟21、對去除干擾識別項的表格圖片進行RGB三通道處理,以形成至少兩個表格圖片層;
步驟22、通過卷積變換對每個表格圖片層進行特征提??;
步驟23、在第一表格圖片層中,預測出字條在第一表格圖片層中的字條位置坐標;
步驟24、在第二表格圖片層中,通過圖像信息和應用語言模型得到與字條相對應的文字內容。
上述的一種處理表格圖片中框選文字的方法,其中,在步驟23中,字條位置坐標包括左上坐標(x0,y0)、右上坐標(x1,y1)、右下坐標(x2,y2)、左下坐標(x3,y3)。
上述的一種處理表格圖片中框選文字的方法,其中,在步驟3中,根據字條位置坐標進行表格行與表格列的切分,將文字內容導入字條位置中,根據語義判斷進行單元格的結合,以完成整體表格的還原。
上述的一種處理表格圖片中框選文字的方法,其中,還包括步驟4、呈現還原后的表格。
本發明還提供一種處理表格圖片中框選文字的裝置,包括:預處理模塊、識別模塊與表格還原模塊;
預處理模塊,用于去除表格圖片中的干擾識別項;
識別模塊,利用聯合訓練模型,在表格圖片中圈選出字條,獲取字條在表格圖片中的字條位置坐標、并識別出與字條相對應的文字內容;
表格還原模塊,利用表格特性對字條、字條位置坐標與文字內容進行表格還原。
上述的裝置,其中,所述預處理模塊對表格圖片進行的預處理包括圖片角度糾偏操作、或水印印章去除操作。
上述的裝置,其中,所述識別模塊的實施步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海犀語科技有限公司,未經上海犀語科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811317237.7/2.html,轉載請聲明來源鉆瓜專利網。





