[發明專利]文本區域檢測方法、裝置、電子設備和計算機存儲介質有效
| 申請號: | 202011546450.2 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112287924B | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 楊家博;秦勇 | 申請(專利權)人: | 北京易真學思教育科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34;G06K9/38;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 楊瑾瑾;林軍 |
| 地址: | 100144 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 區域 檢測 方法 裝置 電子設備 計算機 存儲 介質 | ||
本申請公開了一種文本區域檢測方法、裝置、電子設備和計算機存儲介質。具體實現方案為包括:將目標圖像輸入目標模型,得到目標模型輸出的多個通道;多個通道包括內縮文本區域概率圖以及角點概率圖;基于目標圖像對應的梯度圖以及內縮文本區域概率圖,得到概率閾值;基于概率閾值,對內縮文本區域概率圖進行二值化、以及對角點概率圖進行二值化,得到內縮文本區域二值圖以及角點二值圖;基于內縮文本區域二值圖以及角點二值圖,確定目標圖像包含的文本區域。
技術領域
本申請涉及圖像處理領域,尤其涉及一種文本區域檢測方法、裝置、電子設備和計算機存儲介質。
背景技術
文本區域檢測應用范圍廣泛,是很多計算機視覺任務的前置步驟,比如圖像搜索、文字識別,身份認證和視覺導航等,文本區域檢測的主要目的是定位文本行或字符在圖像中的位置,文本的精準定位既十分重要又具備挑戰,因為相較于通用目標檢測來說,文字具有多方向、不規則形狀、極端長寬比、字體、顏色、背景多樣等特點,因此,往往在通用目標檢測上較為成功的算法無法直接遷移到文字檢測中,但近年來隨著深度學習的再次興起,對文本區域檢測的研究也成為了一大熱點,出現了大量專用于文本區域檢測的方法。
目前的文本區域檢測方法,雖然能夠實現對文本圖像的檢測,但是應用于密集文本區域檢測時,不僅檢測速度慢,而且檢測效果差,嚴重影響了文本區域檢測效率。
發明內容
為了解決現有技術中上述至少一個問題,本申請實施例提供一種文本區域檢測方法、裝置、電子設備和計算機存儲介質。
第一方面,本申請實施例提供一種文本區域檢測方法,所述方法包括:
將目標圖像輸入目標模型,得到目標模型輸出的多個通道;所述多個通道包括內縮文本區域概率圖以及角點概率圖;
基于所述目標圖像對應的梯度圖以及所述內縮文本區域概率圖,得到概率閾值;
基于所述概率閾值,對所述內縮文本區域概率圖進行二值化、以及對所述角點概率圖進行二值化,得到內縮文本區域二值圖以及角點二值圖;
基于所述內縮文本區域二值圖以及所述角點二值圖,確定所述目標圖像包含的文本區域。
第二方面,本申請實施例提供一種文本區域檢測裝置,所述裝置包括:
模型處理單元,用于將目標圖像輸入目標模型,得到目標模型輸出的多個通道;所述多個通道包括內縮文本區域概率圖以及角點概率圖;
閾值確定單元,用于基于所述目標圖像對應的梯度圖以及所述內縮文本區域概率圖,得到概率閾值;
二值化單元,用于基于所述概率閾值,對所述內縮文本區域概率圖進行二值化、以及對所述角點概率圖進行二值化,得到內縮文本區域二值圖以及角點二值圖;
文本區域確定單元,用于基于所述內縮文本區域二值圖以及所述角點二值圖,確定所述目標圖像包含的文本區域。
第三方面,本申請實施例提供一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本申請任意一項實施例所提供的方法。
第四方面,本申請實施例提供一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行本申請任意一項實施例所提供的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京易真學思教育科技有限公司,未經北京易真學思教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011546450.2/2.html,轉載請聲明來源鉆瓜專利網。





