[發明專利]一種文本檢測方法和裝置在審

申請號：	202011387915.4	申請日：	2020-12-02
公開（公告）號：	CN112183523A	公開（公告）日：	2021-01-05
發明（設計）人：	謝春鴻	申請（專利權）人：	北京云測信息技術有限公司
主分類號：	G06K9/20	分類號：	G06K9/20;G06K9/62
代理公司：	北京國昊天誠知識產權代理有限公司 11315	代理人：	許振新
地址：	100016 北京市朝***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種文本檢測方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了一種文本檢測方法和裝置，該方法包括：獲取包含文本的圖片；對所述圖片進行文本檢測，得到檢測結果，所述檢測結果中包括文本框和非文本框；基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類，得到文本框和非文本框。在得到文本檢測結果后，由于可以使用預先訓練的分類模型對檢測結果中的文本框和非文本框進行分類，因此，可以確定出檢測結果中哪些是文本框，哪些是非文本框，從而可以過濾掉其中的非文本框，僅保留文本框，改善文本檢測效果；進一步地，在后續進行文本識別時，可以僅基于檢測結果中的文本框進行文本識別，從而可以減少文本識別的次數，提高整個文本檢測識別過程的效率。

技術領域

本申請涉及文本檢測領域，尤其涉及一種文本檢測方法和裝置。

背景技術

目前，在很多應用場景下，都需要對圖片中的文本進行識別，以得到圖片中包含的文本。一般地，在對圖片中的文本進行識別時，可以基于OCR（Optical CharacterRecognition，光學字符識別）實現。具體地，首先，可以對圖片進行文本檢測，得到包含文本的文本框，其次，對文本框進行文本識別，進而得到圖片中包含的文本。

然而，在實際應用中，在使用OCR對圖片進行文本檢測時，在圖片中包括復雜背景的情況下，檢測結果中會包含非文本框，導致文本檢測的檢測效果不佳，嚴重影響后續的文本識別。

發明內容

本申請實施例提供一種文本檢測方法和裝置，用于解決目前在使用OCR對包含復雜背景的圖片進行文本檢測時，檢測效果不佳的問題。

為解決上述技術問題，本申請實施例是這樣實現的：

第一方面，提出一種文本檢測方法，包括：

獲取包含文本的圖片；

對所述圖片進行文本檢測，得到檢測結果，所述檢測結果中包括文本框和非文本框；

基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類，得到文本框和非文本框。

第二方面，提出一種文本檢測裝置，包括：

獲取單元，獲取包含文本的圖片；

文本檢測單元，對所述圖片進行文本檢測，得到檢測結果，所述檢測結果中包括文本框和非文本框；

分類單元，基于預先訓練的分類模型對所述檢測結果中的文本框和非文本框進行分類，得到文本框和非文本框。