[發明專利]一種表格信息轉錄方法、系統、電子設備和存儲介質在審
| 申請號: | 202010462194.2 | 申請日: | 2020-05-27 |
| 公開(公告)號: | CN111651971A | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 張天澄;徐立凡;馬業恒 | 申請(專利權)人: | 張天澄;徐立凡;馬業恒 |
| 主分類號: | G06F40/183 | 分類號: | G06F40/183 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 215000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 表格 信息 轉錄 方法 系統 電子設備 存儲 介質 | ||
1.一種表格信息轉錄方法,其特征在于,所述方法包括:
獲取帶有表格信息的目標圖像,并從所述目標圖像中提取第一類型和第二類型的表格線條,得到包括第一類型表格線條的第一圖像和包括第二類型表格線條的第二圖像;
對所述第一圖像和所述第二圖像進行運算,得到各單元格的邊線以及各個單元格的頂點位置;
基于單元格的邊線以及單元格的頂點位置,確定單元格區域,并對所述單元格區域進行文本信息識別;
將識別到的文本信息寫入預先構建的目標文件中,以完成圖像中表格信息的轉錄。
2.根據權利要求1所述的方法,其特征在于,從所述目標圖像中提取第一類型和第二類型的表格線條,包括:
對所述目標圖像進行腐蝕和膨脹處理,基于預設的形態學因子從腐蝕和膨脹處理后的圖像中提取第一類型和第二類型的表格線條。
3.根據權利要求1所述的方法,其特征在于,對所述第一圖像和所述第二圖像進行運算,得到各單元格的邊線以及各個單元格的頂點位置,包括:
對所述第一圖像和所述第二圖像進行并集運算得到表格線圖像,并從表格線圖像中確定各單元格的邊線;
對所述第一圖像和所述第二圖像進行交集運算得到格點圖像,并從所述格點圖像中確定各個單元格的頂點位置。
4.根據權利要求1所述的方法,其特征在于,在得到各單元格的邊線以后,所述方法還包括:
基于各單元格邊線確定表格區域,并將區域面積小于預設閾值或區域形狀不規則的表格區域丟棄。
5.根據權利要求1所述的方法,其特征在于,在得到各單元格的邊線以及各個單元格的頂點位置后,所述方法還包括:
按照指定順序進行像素掃描,確定目標格點,其中,所述目標格點為單元格的頂點;
將所述目標格點設為該單元格的左上角頂點,并根據所述目標格點的位置,尋找該單元格其它頂點,若找到則保留該單元格各頂點的位置信息。
6.根據權利要求1所述的方法,其特征在于,在將識別到的文本信息寫入預先構建的指定格式的表格文件之后,所述方法還包括:
將所述表格文件存儲到指定路徑,其中所述指定路徑為預先建立的超鏈接對應的下載路徑。
7.根據權利要求1所述的方法,其特征在于,所述第一類型的表格線條為橫線,所述第二類型的表格線條為豎線。
8.一種表格信息轉錄系統,其特征在于,所述系統包括:
提取模塊,用于獲取帶有表格信息的目標圖像,并從所述目標圖像中提取第一類型和第二類型的表格線條,得到包括第一類型表格線條的第一圖像和包括第二類型表格線條的第二圖像;
運算模塊,用于對所述第一圖像和所述第二圖像進行運算,得到各單元格的邊線以及各個單元格的頂點位置;
識別模塊,用于基于單元格的邊線以及單元格的頂點位置,確定單元格區域,并對所述單元格區域進行文本信息識別;
寫入模塊,用于將識別到的文本信息寫入預先構建的目標文件中,以完成圖像中表格信息的轉錄。
9.一種電子設備,其特征在于,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-7中任一所述的表格信息轉錄方法。
10.一種存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-7中任一所述的表格信息轉錄方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于張天澄;徐立凡;馬業恒,未經張天澄;徐立凡;馬業恒許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010462194.2/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





