[發明專利]數據處理的方法和相關設備在審
| 申請號: | 202210168027.6 | 申請日: | 2022-02-23 |
| 公開(公告)號: | CN116486422A | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 黃永帥;盧寧;都林 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06V30/413;G06V30/414;G06N3/0464;G06N3/0442;G06N3/08 |
| 代理公司: | 北京龍雙利達知識產權代理有限公司 11329 | 代理人: | 周喬;王君 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 相關 設備 | ||
1.一種數據處理的方法,其特征在于,所述方法包括:
獲取待處理的表格圖像;
根據所述表格圖像按照生成式表格識別策略確定表格識別結果,其中,所述生成式表格識別策略用于指示利用標記語言和包圍框不重疊屬性確定所述表格圖像的表格識別結果,所述包圍框用于指示所述表格圖像所關聯的表格中的單元格包括的文本所在位置,所述表格識別結果用于指示所述表格所包括的全局結構和內容;
輸出所述表格識別結果。
2.根據權利要求1所述的方法,其特征在于,所述包圍框不重疊屬性用于指示所述表格所包括的各個單元格所對應的區域無重疊。
3.根據權利要求1所述的方法,其特征在于,所述根據所述表格圖像按照生成式表格識別策略確定表格識別結果,包括:
根據所述表格圖像特征和所述標記語言通過迭代處理獲得所述表格識別結果。
4.根據權利要求3所述的方法,其特征在于,所述迭代處理包括多輪迭代,所述方法還包括:
根據所述表格圖像特征和所述標記語言確定第一迭代獲得的第一包圍框和局部結構,所述第一迭代為所述多輪迭代的任意一輪迭代處理過程,所述第一包圍框用于指示所述第一迭代所獲得的所述局部結構的包圍框,所述局部結構為所述全局結構的部分結構;
當第二迭代獲得所述全局結構時,確定所述第二迭代獲得的處理結果為所述表格識別結果,所述第二迭代是所述迭代處理中在所述第一迭代處理后執行的一次迭代處理,所述處理結果包括所述全局結構和所述內容。
5.根據權利要求4所述的方法,其特征在于,所述方法還包括:
對所述第一迭代獲得的所述第一包圍框進行糾正。
6.根據權利要求5所述的方法,其特征在于,所述對所述第一迭代獲得的所述第一包圍框進行糾正,包括:
根據輸入參數和所述表格圖像對所述第一包圍框進行糾正。
7.根據權利要求5所述的方法,其特征在于,所述對所述第一迭代獲得的所述第一包圍框進行糾正,包括:
在第二包圍框與所述第一包圍框的匹配度大于或等于預設閾值的情況下,根據所述第二包圍框對所述第一包圍框進行糾正,所述第二包圍框為誤差糾偏檢測模型對所述局部結構進行處理得到的,所述誤差糾偏檢測模型為經過訓練的人工智能AI模型。
8.根據權利要求1至7任一項所述的方法,其特征在于,所述方法還包括:
根據所述表格圖像對所述表格識別結果進行糾正,并輸出糾正后的表格識別結果。
9.根據權利要求1至8任一項所述的方法,其特征在于,所述方法還包括:
對所述表格圖像進行特征提取,獲得所述表格圖像特征。
10.根據權利要求1至9任一項所述的方法,其特征在于,
采用以下任意一種標記語言標識所述表格識別結果:超文本標記語言HTML,可擴展標記語言XML,或者拉泰赫LaTex。
11.一種數據處理的裝置,其特征在于,所述裝置包括獲取單元,處理單元和輸出單元,
所述獲取單元,用于獲取待處理的表格圖像;
所述處理單元,用于根據所述表格圖像按照生成式表格識別策略確定表格識別結果,其中,所述生成式表格識別策略用于指示利用標記語言和包圍框不重疊屬性確定所述表格圖像的表格識別結果,所述包圍框用于指示所述表格圖像所關聯的表格中的單元格包括的文本所在位置,所述表格識別結果用于指示所述表格所包括的全局結構和內容;
所述輸出單元,用于輸出所述表格識別結果。
12.根據權利要求11所述的裝置,其特征在于,
所述包圍框不重疊屬性用于指示所述表格所包括的各個單元格所對應的區域無重疊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210168027.6/1.html,轉載請聲明來源鉆瓜專利網。





