[發明專利]一種文本識別方法、裝置、電子設備和存儲介質在審
| 申請號: | 202110194111.0 | 申請日: | 2021-02-20 |
| 公開(公告)號: | CN113591858A | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 伍敏慧;梅利健;林榆耿 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 李漢亮 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 識別 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種文本識別方法、裝置、電子設備和存儲介質;本申請可以獲取待文本識別的目標圖像、以及計算機設備中顯卡的內存信息;基于所述顯卡的內存信息,確定計算機設備所能處理的目標圖像尺寸;當目標圖像的尺寸大于目標圖像尺寸時,根據目標圖像尺寸對目標圖像進行切分處理,得到目標圖像的切分子圖像;對切分子圖像進行文本檢測,得到切分子圖像的切分文本區域的位置信息;根據所述位置信息,將切分文本區域映射到目標圖像上,確定目標圖像的文本區域;對目標圖像中所有的文本區域進行文本識別,得到目標圖像的文本識別結果。本申請可以在顯存限制下識別任意尺寸圖像上的文字,不受圖像長寬比的限制,保證文本識別的精度。
技術領域
本申請涉及計算機技術領域,具體涉及一種文本識別方法、裝置、電子設備和存儲介質。
背景技術
隨著計算機技術的發展,人工智能技術在多個領域得到應用,并發揮越來越重要的價值。文本識別是人工智能技術中的一個重要應用領域,當前文本識別技術已經較為成熟,利用光學字符識別的算法來識別圖片上的文本,經過文本檢測定位文本所在的區域,再將得到的文本框送入文本識別模型中進行文本識別。
對于長寬比較大的圖片,在進行文本識別時可能會造成需要分配的顯存超過了計算機設備中顯存的限制。在目前的相關技術中,通常可以按照一定的長寬比來切分長圖,將一張圖片切成多張圖片來檢測。這種方法對顯存的要求較低,但切圖很有可能會切到文字,造成文本識別錯誤。
發明內容
本申請實施例提供一種文本識別方法、裝置、電子設備和存儲介質,可以在顯存限制下識別任意尺寸圖像上的文字,不受圖像長寬比的限制,保證文本識別的精度。
本申請實施例提供一種文本識別方法,包括:
獲取待文本識別的目標圖像、以及計算機設備中顯卡的內存信息;
基于所述顯卡的內存信息,確定所述計算機設備所能處理的目標圖像尺寸;
當所述目標圖像的尺寸大于所述目標圖像尺寸時,根據所述目標圖像尺寸對所述目標圖像進行切分處理,得到所述目標圖像的切分子圖像;
對所述切分子圖像進行文本檢測,得到所述切分子圖像的切分文本區域的位置信息;
根據所述位置信息,將所述切分文本區域映射到所述目標圖像上,確定所述目標圖像的文本區域;
對所述目標圖像中所有的文本區域進行文本識別,得到所述目標圖像的文本識別結果。
相應的,本申請實施例提供一種文本識別裝置,包括:
獲取單元,用于獲取待文本識別的目標圖像、以及計算機設備中顯卡的內存信息;
確定單元,用于基于所述顯卡的內存信息,確定所述計算機設備所能處理的目標圖像尺寸;
切分單元,用于當所述目標圖像的尺寸大于所述目標圖像尺寸時,根據所述目標圖像尺寸對所述目標圖像進行切分處理,得到所述目標圖像的切分子圖像;
檢測單元,用于對所述切分子圖像進行文本檢測,得到所述切分子圖像的切分文本區域的位置信息;
映射單元,用于根據所述位置信息,將所述切分文本區域映射到所述目標圖像上,確定所述目標圖像的文本區域;
識別單元,用于對所述目標圖像中所有的文本區域進行文本識別,得到所述目標圖像的文本識別結果。
可選的,在本申請的一些實施例中,所述切分單元可以包括確定子單元、第一切分子單元、更新子單元和第二切分子單元,如下:
所述確定子單元,用于根據所述目標圖像尺寸,確定所述目標圖像的當前切分位置;
第一切分子單元,用于基于當前切分位置,對所述目標圖像進行切分處理,得到所述目標圖像的切分子圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110194111.0/2.html,轉載請聲明來源鉆瓜專利網。





