[發明專利]數據處理的方法和相關設備在審
| 申請號: | 202210168027.6 | 申請日: | 2022-02-23 |
| 公開(公告)號: | CN116486422A | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 黃永帥;盧寧;都林 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06V30/413;G06V30/414;G06N3/0464;G06N3/0442;G06N3/08 |
| 代理公司: | 北京龍雙利達知識產權代理有限公司 11329 | 代理人: | 周喬;王君 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 相關 設備 | ||
一種數據處理的方法和裝置,該方法包括:獲取待處理的表格圖像;根據該表格圖像按照生成式表格識別策略確定表格識別結果,其中,該生成式表格識別策略用于指示利用標記語言和包圍框不重疊屬性確定該表格圖像的表格識別結果,該包圍框用于指示該表格圖像所關聯的表格中的單元格包括的文本所在位置,該表格識別結果用于指示該表格所包括的全局結構和內容;輸出該表格識別結果。由此對表格圖像進行識別,可以提高表格識別結果的準確性。
本申請要求于2022年1月12日提交中國專利局、申請號為202210029776.0、發明名稱為“數據處理的方法”的中國專利申請的優先權,其全部內容通過引用結合在本申請中。
技術領域
本申請涉及人工智能領域,尤其涉及一種數據處理的方法、裝置、系統和數據處理芯片。
背景技術
圖像表格識別(簡稱為表格識別)是將圖像中的表格轉換為可編輯的表格(例如,超文本標記語言(hypertext?markup?language,HTML)等格式)的人工智能(artificialintelligence,AI)技術。圖像表格識別在文檔格式的自動化處理中扮演著重要角色。
相關技術中提供的表格識別方法,首先對圖像中的表格進行行列線檢測,然后計算該表格包括的所有行列線之間的交叉點,即可還原出該表格包括的每個單元格的坐標(即單元格位置)。在獲得所有單元格位置后,按照單元格位置對所有單元格進行排列,并通過啟發式算法獲取單元格的行列信息(例如,起始行、起始列、跨行或者跨列),以得到表格識別結果。這種實現方式中,當行列線不明顯或者行列線傾斜時,會存在行列線漏檢或者交叉點計算錯誤,基于這種方式得到的表格識別結果的準確性較差。
因此,亟需一種數據處理的方法,該方法可以提高表格識別結果的準確性。
發明內容
本申請提供一種數據處理的方法、裝置、系統和數據處理芯片,可以提高表格識別結果的準確性。
第一方面,提供了一種數據處理的方法,包括:獲取待處理的表格圖像;根據該表格圖像按照生成式表格識別策略確定表格識別結果,其中,該生成式表格識別策略用于指示利用標記語言和包圍框不重疊屬性確定該表格圖像的表格識別結果,該包圍框用于指示該表格圖像所關聯的表格中的單元格包括的文本所在位置,該表格識別結果用于指示該表格所包括的全局結構和內容;輸出該表格識別結果。
標記語言可以用于指示表格局部結構,該表格局部結構為表格全局結構中的部分結構。其中,表格結構可以包括:表格的行、表格的列、表格包括的單元格、表格中的每個單元格、以及表格中的每個單元格包括的文本對應的包圍框。文本對應的包圍框,可以是指包圍該單元格包括的文本的任意多邊形的包圍框。表格中的單元格包括的文本所在位置,可以理解為,表格中的單元格包括的文本對應的包圍框的位置。
上述技術方案中,能夠根據用于標識表格結構的標記語言和該表格中的單元格包括的文本位于表格中的位置對表格進行識別,以得到表格識別的結果,避免了傳統技術中僅根據表格的行列結構(該表格的行列結構不包括包圍框)對表格進行識別存在識別結果的準確性較差的問題,本申請提供的方法可以提高表格識別結果的準確性。
在一種可能的設計中,該包圍框不重疊屬性用于指示該表格所包括的各個單元格所對應的區域無重疊。
其中,該表格所包括的各個單元格所對應的區域無重疊,即該表格包括的各個單元格不存在重疊,且該各個單元格包括的文本對應的包圍框也不存在重疊。包圍框可以是指包圍一個單元格包括的文本的任意多邊形的框。包圍框,又可稱為文本對應的包圍框或單元格文本塊。
可選的,在一些實現方式中,表格包括的單元格是按照行的順序排列的。
上述技術方案中,對表格圖像進行表格識別時,不僅利用了用于標記表格結構的標記語言,同時還利用了表格中的包圍框不重疊屬性。也就是說,該方法充分利用了表格的特征,有利于提高表格識別結果的魯棒性和準確性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210168027.6/2.html,轉載請聲明來源鉆瓜專利網。





