[發明專利]文檔圖像識別方法和裝置、電子設備、計算機可讀介質在審
| 申請號: | 202111505415.0 | 申請日: | 2021-12-10 |
| 公開(公告)號: | CN114187448A | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 李晨霞;杜宇寧;周軍;郭若愚;楊燁華;賴寶華;劉其文;胡曉光;于佃海;馬艷軍 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V30/148;G06V10/22;G06V10/74;G06V30/19;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06V30/10 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 圖像 識別 方法 裝置 電子設備 計算機 可讀 介質 | ||
1.一種文檔圖像識別方法,所述方法包括:
獲取待識別文檔圖像;
檢測所述待識別文檔圖像是否具有至少一個識別要素;
響應于所述待識別文檔圖像中具有至少一個識別要素,將所述待識別文檔圖像劃分為至少一個版面區域;
針對各個識別要素,對該識別要素對應的版面區域進行識別,得到該識別要素對應的版面區域的識別結果。
2.根據權利要求1所述的方法,其中,所述識別要素包括:文本;所述針對各個識別要素,對該識別要素對應的版面區域進行識別,得到該識別要素對應的版面區域的識別結果,包括:
對所述文本對應的版面區域進行文本識別,得到文字以及所述文字在所述待識別文檔圖像的位置信息。
3.根據權利要求1或2所述的方法,其中,所述識別要素包括:表格;所述對各個識別要素,對該識別要素對應的版面區域進行識別,得到該識別要素對應的版面區域的識別結果,包括:
對所述表格對應的版面區域進行表格識別,得到可編輯表格。
4.根據權利要求3所述的方法,其中,所述對所述表格對應的版面區域進行表格識別,得到可編輯表格,包括:
對所述表格對應的版面區域進行單行文本檢測,得到所述表格對應的所述版面區域上單文本行的位置信息;
對所述單文本行進行文本識別,得到所述表格對應的版面區域上文字和所述文字的位置;
識別所述表格對應的版面區域中的表格結構,所述表格結構包括:所述表格中單元格、各個單元格的位置;
基于各個單元格的位置以及所述單文本行的位置信息,聚合所述單文本行,得到所述單文本行與各個單元格的位置對應關系;
基于所述單文本行對應的單元格的位置、所述文字和所述文字的位置,對同一單元格的文本進行拼接,得到每個單元格內的文本內容;
將所述表格結構和所述各單元格內的文本內容結合,得到可編輯的表格。
5.一種文檔圖像識別方法,所述方法包括:
獲取待識別文檔圖像;
將所述待識別文檔圖像輸入預先訓練完成的版面識別模型,以使所述版面識別模型檢測所述待識別文檔圖像是否具有至少一個識別要素;
響應于所述待識別文檔圖像具有至少一個識別要素,得到所述版面識別模型輸出的至少一個版面區域;
獲取與各個識別要素對應的、預先訓練完成的識別要素模型,每個識別要素模型用于識別一種識別要素;
針對各個識別要素,采用獲取的識別要素模型,對該識別要素對應的版面區域進行識別,得到該識別要素對應的版面區域的識別結果。
6.根據權利要求5所述的方法,其中,所述識別要素包括:文本,所述識別要素模型包括:文本識別模型,所述針對各個識別要素,采用獲取的識別要素模型,對該識別要素對應的版面區域進行識別,得到該識別要素對應的版面區域的識別結果,包括:
將所述文本對應的版面區域輸出給文本識別模型,得到所述文本識別模型輸出的文字以及所述文字在所述獲取的文檔圖像中的位置信息。
7.根據權利要求5或6所述的方法,其中,所述識別要素包括:表格,所述識別要素模型包括:表格識別模型,所述針對各個識別要素,采用獲取的識別要素模型,對該識別要素對應的版面區域進行識別,得到該識別要素對應的版面區域的識別結果,包括:
將所述表格對應的版面區域輸出給表格識別模型,得到所述表格識別模塊輸出的可編輯表格。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111505415.0/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





