[發明專利]一種文本檢測方法和裝置在審
| 申請號: | 202011387915.4 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112183523A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 謝春鴻 | 申請(專利權)人: | 北京云測信息技術有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許振新 |
| 地址: | 100016 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 檢測 方法 裝置 | ||
本申請公開了一種文本檢測方法和裝置,該方法包括:獲取包含文本的圖片;對所述圖片進行文本檢測,得到檢測結果,所述檢測結果中包括文本框和非文本框;基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類,得到文本框和非文本框。在得到文本檢測結果后,由于可以使用預先訓練的分類模型對檢測結果中的文本框和非文本框進行分類,因此,可以確定出檢測結果中哪些是文本框,哪些是非文本框,從而可以過濾掉其中的非文本框,僅保留文本框,改善文本檢測效果;進一步地,在后續進行文本識別時,可以僅基于檢測結果中的文本框進行文本識別,從而可以減少文本識別的次數,提高整個文本檢測識別過程的效率。
技術領域
本申請涉及文本檢測領域,尤其涉及一種文本檢測方法和裝置。
背景技術
目前,在很多應用場景下,都需要對圖片中的文本進行識別,以得到圖片中包含的文本。一般地,在對圖片中的文本進行識別時,可以基于OCR(Optical CharacterRecognition,光學字符識別)實現。具體地,首先,可以對圖片進行文本檢測,得到包含文本的文本框,其次,對文本框進行文本識別,進而得到圖片中包含的文本。
然而,在實際應用中,在使用OCR對圖片進行文本檢測時,在圖片中包括復雜背景的情況下,檢測結果中會包含非文本框,導致文本檢測的檢測效果不佳,嚴重影響后續的文本識別。
發明內容
本申請實施例提供一種文本檢測方法和裝置,用于解決目前在使用OCR對包含復雜背景的圖片進行文本檢測時,檢測效果不佳的問題。
為解決上述技術問題,本申請實施例是這樣實現的:
第一方面,提出一種文本檢測方法,包括:
獲取包含文本的圖片;
對所述圖片進行文本檢測,得到檢測結果,所述檢測結果中包括文本框和非文本框;
基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類,得到文本框和非文本框。
第二方面,提出一種文本檢測裝置,包括:
獲取單元,獲取包含文本的圖片;
文本檢測單元,對所述圖片進行文本檢測,得到檢測結果,所述檢測結果中包括文本框和非文本框;
分類單元,基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類,得到文本框和非文本框。
第三方面,提出一種電子設備,該電子設備包括:
處理器;以及
被安排成存儲計算機可執行指令的存儲器,該可執行指令在被執行時使該處理器執行以下操作:
獲取包含文本的圖片;
對所述圖片進行文本檢測,得到檢測結果,所述檢測結果中包括文本框和非文本框;
基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類,得到文本框和非文本框。
第四方面,提出一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲一個或多個程序,所述一個或多個程序當被包括多個應用程序的電子設備執行時,使得所述電子設備執行以下方法:
獲取包含文本的圖片;
對所述圖片進行文本檢測,得到檢測結果,所述檢測結果中包括文本框和非文本框;
基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類,得到文本框和非文本框。
本申請實施例采用的上述至少一個技術方案能夠達到以下有益效果:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京云測信息技術有限公司,未經北京云測信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011387915.4/2.html,轉載請聲明來源鉆瓜專利網。





